Está en la página 1de 63

PROBABILIDADES

La probabilidad nos permite estudiar o analizar los fenmenos o procesos llamados aleatorios.

ESPACIO MUESTRAL Y EVENTOS

El conjunto S de todos los resultados posibles de un experimento aleatorio dado se llama


espacio muestral. Un evento A es un conjunto de resultados o, en otras palabras, un
subconjunto del espacio muestral S. Como un evento es un conjunto, podemos combinar
eventos para formar nuevos eventos usando las varias operaciones entre conjuntos:

(1) es el evento que ocurre siempre y cuando ocurra o o (o ambos).


(2) es el evento que ocurre siempre y cuando ocurran tanto como .
(3) el complemento de , es el evento que ocurre siempre y cuando no ocurra .

Dos eventos y se llaman mutuamente excluyentes si son disyuntos, o sea, . En


otras palabras, y son mutuamente excluyentes si y slo si no ocurren simultneamente.

Ejemplo 1.

Experimento: Lance un dado y observe el nmero que resulta. El espacio muestral es,

S={

Sea A el evento de que salga un nmero par, B de que salga un nmero impar y C de que
salga un nmero primo.

A={

B={

C={

Encuentre:

PROBABILIDAD CLSICA

Se da el nombre de probabilidad clsica cuando sta se toma objetivamente (en sentido


prctico) y se puede considerar de dos maneras: a priori y a posteriori.

Sea S un espacio muestral finito y A un evento del espacio muestral, entonces la probabilidad
de A se denota P(A) y se define:

( )

Estadstica Inferencial Pgina 1


Jorge Luis Bustos Galindo
Ejemplo 2.

Se lanza un dado dos veces; halle la probabilidad de los eventos siguientes: A la suma de los
puntos es siete y B la suma de los puntos es menor o igual a cinco.

S={

A={

B={

P(A) =

P(B) =

PROPIEDADES ELEMENTALES DE LA PROBABILIDAD

Las reglas generales de probabilidad las podemos dividir en dos grupos. Un primer grupo
formado por las reglas que podramos llamar primarias o bsicas, llamadas axiomas. Estas
reglas no se aprecian directamente en la solucin de problemas, pero son las que dan un
soporte lgico a las que se utilizan directamente en la solucin de tales problemas y que se
llaman teoremas. Establecemos en primera instancia los axiomas.

Axioma 1. Si A es un evento del espacio muestral S, entonces P(A) representa un nmero


entre 0 y 1 incluidos. Esto es,

( ) .

Axioma 2. Si S es el espacio muestral asociado a un experimento aleatorio, entonces P(S) es


igual a 1, o sea,

( ) .

Axioma 3. Si A y B son eventos mutuamente excluyentes, entonces la probabilidad de A o B,


( ), es igual a la suma de las probabilidades individuales. Esto es,

( ) ( ) ( ).

A partir de los tres axiomas anteriores se deducen los teoremas que constituyen reglas para
calcular probabilidades de situaciones ms o menos complejas.

Teorema 1. Si A es el evento vaco entonces su probabilidad es cero. Es decir,

( ) .
c c
Teorema 2. Si A es un evento y A su complemento, entonces la probabilidad de A es igual a
uno menos la probabilidad de A. Esto es,

( ) ( ).

Ejemplo 3. Suponga que en una urna hay cuatro bolas blancas y seis rojas. De la urna se
extrae al azar una bola y sea A: la bola extrada es roja. Hallar la probabilidad de que la bola
extrada no sea roja.

( )

Teorema 3. Si A y B son dos eventos del espacio muestral S, entonces

( ) ( ) ( ) ( ).

Estadstica Inferencial Pgina 2


Jorge Luis Bustos Galindo
Ejemplo 4. En un curso de 10 hombres y 20 mujeres, la mitad de los hombres y la mitad de
las mujeres tienen ojos pardos. Encuentre la probabilidad de que una persona escogida al azar
sea hombre o tenga ojos pardos.

A={

B={

( )

PROBABILIDAD CONDICIONAL

Sean A y B dos eventos, la probabilidad condicional de A dado B se denota y se define de la


manera siguiente:

( )
( ) ( )
( )

Igualmente se tiene que

( )
( ) ( )
( )

como la probabilidad de B dado A.

Ejemplo 5. La oficina de Accin Social lleva a cabo un censo de todas las personas que viven
en una pequea comunidad. Los encuestadores anotan en una relacin el nmero de visitas
que una persona hace al centro de salud y las condiciones sanitarias de la vivienda que habita.
Los resultados son los siguientes:

Tabla 1. Nmero de visitas que una persona hace al centro de salud y las condiciones
sanitarias de la vivienda que habita.

Condiciones sanitarias
Nmero de visitas Total
Buenas Malas

Dos o menos 700 100 800

Ms de dos 800 400 1200

Total 1 500 500 2 000

Con base en esta tabla, si preguntamos, cul es la probabilidad de que una persona escogida
al azar viva en malas condiciones sanitarias?

A={
P(A) =
Si la pregunta ahora es, cul es la probabilidad de que una persona escogida al azar viva en
malas condiciones sanitarias, dado que visita dos veces o menos el centro de salud?

B={
P(A/B) =

Estadstica Inferencial Pgina 3


Jorge Luis Bustos Galindo
TEOREMA DE LA PROBABILIDAD TOTAL

Este teorema o regla de probabilidad total nos indica cmo calcular la probabilidad de un
evento A cuando conocemos las probabilidades condicionales [ ] en donde los forman
una particin del espacio muestral S.

Supongamos que } es una particin de un espacio muestral S. Si A es un evento de S.


Entonces, [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ]

Ejemplo 6. En una fbrica de tornillos, las mquinas A, B y C fabrican 20, 30 y 50% de la


produccin total respectivamente. De lo que producen 2, 3 y 5% respectivamente son tornillos
defectuosos. Con la produccin total se hace un solo lote y se extrae un tornillo; halle la
probabilidad de que sea defectuoso.

Sean los eventos,


A: el tornillo escogido es defectuoso.
el tornillo proviene de la mquina A.
el tornillo proviene de la mquina B.
el tornillo proviene de la mquina C.

De lo anterior se tiene que,


[ ] , [ ] y [ ] . Adems, [ ] , [ ] y [ ]
.

Aplicando el teorema o regla de la probabilidad total,


[ ] ( )( ) ( )( ) ( )( )

Hay una probabilidad del 3.8% de que el artculo escogido sea defectuoso.

TEOREMA DE BAYES

El teorema o regla de Bayes es una tcnica que nos permite obtener la probabilidad
condicional de un evento cuando mediante el efecto tratamos de determinar la probabilidad de
la causa. Este resultado ha sido muy utilizado para estudiar fenmenos sociales; sin embargo,
por el empleo de probabilidades subjetivas a sido muy cuestionado su uso.

El teorema de Bayes trata de responder los interrogantes tales como: si el evento B ocurri,
cul es la probabilidad de que haya sido generado por el evento ?,Cual por ?, etc.

Sea } es una particin de un espacio muestral S con [ ] y A un evento de S.


Entonces,

[ ] [ ]
[ ]
[ ] [ ] [ ] [ ] [ ] [ ]

Ejemplo 7. A partir del problema de la fbrica de tornillos (ejemplo 6), halle la probabilidad de
que el tornillo provenga de la mquina C, dado que es defectuoso.

En este caso debemos calcular la probabilidad [ ], por el teorema de Bayes nos da

[ ] [ ]
[ ]
[ ] [ ] [ ] [ ] [ ] [ ]

( )( )
[ ]
( )( ) ( )( ) ( )( )

Hay una probabilidad del 66% de que el tornillo defectuoso provenga de la mquina C.

Estadstica Inferencial Pgina 4


Jorge Luis Bustos Galindo
INDEPENDENCIA DE EVENTOS

Cuando la ocurrencia de un evento A no est influenciada ni influye sobre la ocurrencia de otro,


decimos que los eventos son independientes. Formalmente la independencia se define de la
manera siguiente:

Dados dos eventos A y B, se dicen independientes si cumplen que

( ) ( ) ( )

Ejemplo 8. Suponga que se lanza una moneda dos veces. Sean los eventos, A el primer
resultado es cara y B el segundo resultado es sello. Son mutuamente independientes los
eventos.

( )
( )
( )=
( ) ( ) ( )

Estadstica Inferencial Pgina 5


Jorge Luis Bustos Galindo
GUA DE CLASE N 1

1. Explique el significado de los siguientes trminos:


a. Experimento aleatorio
b. Espacio muestral
c. Evento o suceso

2. Se lanza una moneda cuatro veces. Encuentre todos los sucesos elementales del espacio
muestral.

3. Supongamos que lanzamos una moneda y un dado, y que el espacio muestral S consta de
doce elementos:

S = C1, C2, C3, C4, C5, C6, S1, S2, S3, S4, S5, S6}

a. Exprese explcitamente los siguientes eventos:


A = sale cara y un nmero par}
B = {sale un nmero primo}
C = {sale sello y un nmero impar}
b. Exprese explcitamente el evento: (i) ocurre A o B, (ii) ocurre B y C, (iii) solamente
ocurre en B, y (iv) no ocurre en A.
c. Cules parejas de eventos A, B Y C son mutuamente excluyentes?

4. Determine la probabilidad de cada evento:


a. Sale un nmero par en el lanzamiento de un dado no cargado.
b. Al sacar una sola carta de una baraja de 52 cartas sale una K.
c. Sale por lo menos un sello al lanzar tres monedas no cargadas.
d. Sale una bola blanca al sacar una sola bola de una bolsa con cuatro bolas blancas, tres
rojas y cinco azules.

5. En un curso de 20 hombres y 30 mujeres, un quinto de los hombres y un quinto de las


mujeres son becados. Encuentre la probabilidad de que una persona escogida al azar sea
mujer o la persona sea becada.

6. En la tabla que sigue se da el cargo y sexo de los empleados de una empresa.

Sexo Total
Cargo
Hombres Mujeres
Operarios 80 113 193
Administrativos 30 17 47
Directivos 4 6 10
Total 114 136 250

Recursos humanos de la empresa desea otorgar un premio como estimulo especial y para
ello decide seleccionar al alzar uno de los trabajadores. Calcular la probabilidad de que la
persona sea administrativo dado que es mujer.

7. Se lanza un dado no cargado. Considere los eventos:


A = {2, 4, 6}
B = {1, 2}
C = {1, 2, 3, 4}
a. Encuentre P(AB), P(AUB).
b. Encuentre P(A/B) y P(B/A).
c. Encuentre P(A/C) y P(C/A).
d. Son A y B independientes?, B y C? y A y C?

Estadstica Inferencial Pgina 6


Jorge Luis Bustos Galindo
8. Sean A y B eventos con P(A) = , P(B) = , y P(AUB) = .
a. Encuentre P(A/B) y P(B/A).
b. Son A y B independientes?

9. Supongamos que lanzamos tres monedas una vez. Y sea:


A = {todas las caras o todas sellos}
B = {por lo menos dos caras}
C = {cuando ms dos caras}
a. Encuentre P(AUB), P(AUC) y P(BUC).
b. Encuentre P(A/B) y P(C/A).

10. Sean A y B eventos independientes con P(A) = 0.3 y P(B) = 0.4. Encuentre:
a. P(AB) y P(AUB).
b. P(A/B) y P(B/A).

11. En la sala de pediatra de un hospital, el 60% de los pacientes son nias. De los nios el
35% son menores de 24 meses. El 20% de las nias tienen menos de 24 meses. Un
pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una nia.

12. Un mdico cirujano se especializa en cirugas estticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugas
correctivas. Se sabe adems, que son de gnero masculino el 25% de los que se realizan
correcciones faciales, 15% implantes mamarios y 40% otras cirugas correctivas. Si se
selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de gnero masculino
b. Si resulta que es de gnero masculino, determine la probabilidad que se haya realizado
una ciruga de implantes mamarios.

Estadstica Inferencial Pgina 7


Jorge Luis Bustos Galindo
DISTRIBUCIN DE PROBABILIDAD

Los experimentos aleatorios originan resultados y los resultados nos permiten tomar
decisiones. Un mismo experimento aleatorio se puede llevar acabo para tomar distintas
decisiones. Sin embargo, a pesar de que el propsito sea distinto cuando se lleva a cabo un
experimento aleatorio, ste no cambia su comportamiento por el simple hecho de que los
propsitos cambien. Lo anterior nos est indicando que una cosa son los distintos resultados
de un experimento y otra los propsitos que perseguimos cuando lo realizamos. El medio por el
cual expresamos nuestro aspecto de inters al llevar a cabo un experimento aleatorio es el de
variable aleatoria.

Variable Aleatoria

Una variable aleatoria es aquella que asume valores de acuerdo con los resultados de un
experimento aleatorio. Las variables aleatorias generalmente son designadas por las letras X,
Y, Z.

En el siguiente ejemplo se ilustra cmo se asocia una variable aleatoria a un experimento.

Ejemplo 1. Se lanza una moneda tres veces. Sabemos que el espacio muestral
correspondiente a este experimento aleatorio est dado por:

S = {ccc, ccs, csc, scc, ssc, scs, css, sss}.

Si de los resultados del lanzamiento de la moneda nos interesa el nmero de caras que se
obtienen en cada lanzamiento, entonces definimos la variable X: nmero de caras en los tres
lanzamientos. Los valores posibles de esta variable son:

X = 0, que indica que no se obtienen caras, o sea, {sss}.


X = 1, que indica que se obtiene una cara, {css, scs,ssc}.
X = 2, que indica que se obtiene dos caras, {ccs, csc,scc}.
X = 3, que indica que se obtiene tres caras, {ccc}.
Por lo anterior se tiene que las probabilidades respectivas son,
P[X = 0] = 1/8, P[X = 1] = 3/8, P[X = 2] = 3/8, P[X = 3] = 1/8.
Estos resultados se pueden resumir en una tabla como la siguiente, llamada distribucin de
probabilidad.

X 0 1 2 3

P[X = x]

Observemos que la suma de las probabilidades,


P[X = 0] + P[X = 1] + P[X = 2] + P[X = 3] = . En general, para cualquier
distribucin de probabilidad discreta debe darse que la suma de las probabilidades de todos los
valores que pueda asumir la variable aleatoria de un experimento debe ser igual a 1.

Ejemplo 2. Consideremos el lanzamiento de dos dados una vez. Sea X: suma de puntos de las
dos caras. Hallar la distribucin de probabilidad de esta variable aleatoria.

P[X = x]

Estadstica Inferencial Pgina 8


Jorge Luis Bustos Galindo
Una vez que se haya definido la variable, hallar las siguientes probabilidades:

(a) [ ]
(b) [ ]

VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA

La distribucin de probabilidad de una variable aleatoria proporciona un modelo para


distribucin terica de la variable. La distribucin de probabilidad de una poblacin es anloga
a la distribucin de frecuencia relativa de los datos (muestra). Luego, es de esperarse que cada
distribucin de probabilidad tenga asociada medidas similares a las medidas descriptivas que
se han sealado para los datos (muestra).

Valor esperado

El valor esperado o esperanza matemtica de una variable aleatoria X, desempea o


equivale al concepto de promedio de los datos.

Sea X una variable aleatoria discreta que asume los valores x 1, x2, x3, , xn con probabilidades
respectivas P[X = x1], P[X = x2], P[X = x3], ,P[X = xn] el valor esperado de X se denota y
define de la manera siguiente:

[ ] [ ] [ ] [ ] [ ] [ ]

Ejemplo 3. Consideremos la variable aleatoria X: nmero de puntos que muestra la cara


superior de un dado despus de un lanzamiento. Entonces la distribucin de probabilidad es,

X 1 2 3 4 5 6

P[X = x]

El valor esperado o esperanza matemtica,

[ ] ( ) ( ) ( ) ( ) ( ) ( )

Cmo interpretar este resultado? Si dijramos que es el puntaje que usted debe esperar que
le d cuando lanza el dado muchas veces, con justa razn podra decir que eso es imposible,
puesto que podrn verse en el dado tres o cuatro puntos, pero jams 3.5 puntos. Estamos de
acuerdo con usted, pero le proponemos que no cuente los puntos de cada lanzamiento sino
que sume el puntaje de los dos lanzamientos y los promedie, puede hallar la lgica al valor de
3.5. Adems se convencer que lo dicho a cerca de 3.5 es cierto. A pesar de que esta
interpretacin que le hemos dado al valor de 3.5 es acertada, en la prctica el valor esperado
se interpreta de una manera un poco distinta, que en el ejemplo presente es: si lanzamos el
dado un nmero grande de veces y tomamos la media aritmtica de la suma de los distintos
puntajes que se van obteniendo entonces, la media tiende a 3.5. Igual interpretacin seria para
cualquier otra situacin.

Ejemplo 4. Supongamos que dos jugadores A y B, se enfrentan en un juego que consiste en el


lanzamiento de una moneda al aire. Si sale cara A gana $1; pero si sale sello A pierde $1.
La variable que representa la ganancia de A por cada jugada est dada por:

Estadstica Inferencial Pgina 9


Jorge Luis Bustos Galindo
{

Si suponemos que la moneda est balanceada, la probabilidad de obtener cara (sello) es 0.5,
entonces la variable X tiene la siguiente distribucin:

X -$1 $1

P[X = x] 0.5 0.5

As que el valor esperado de X (ganancia esperada del jugador) est dado por E[X] = (-1)(0.5)
+ (1)(0.5) = 0, lo que quiere decir que si estas personas juegan un gran nmero de veces, a la
larga no hay ganancias, es decir, no hay ganador ni perdedor.

Pero si ahora vamos a suponer que la moneda est diseada de tal forma que la posibilidad de
obtener cara es de 2/3 y la de obtener sello es de 1/3. En este caso la distribucin de X
sera:

X -$1 $1

P[X = x]

Y la ganancia esperada (por jugada) para a sera E[X] = ( ) ( ) ( )( ) , lo que quiere


decir que si juegan unas 3000 veces, se espera que A gane $1000.

Propiedades del valor esperado

(1) E[c] = c, al ser c una constante (un nmero).


(2) E[cX] = cE[X], al ser c una constante y X una variable aleatoria.
(3) E[X + c] = E[X] + c, al ser c una constante y X una variable aleatoria.
(4) E[X + Y] = E[X] + E[Y], al ser X y Y variables aleatorias.
(5) E[aX + bY] = aE[X] + bE[Y], al ser a y b contantes; X y Y variables aleatorias.

Varianza y Desviacin estndar

As como las medidas de posicin tienen su generalizacin mediante el valor esperado, la


variabilidad de los datos (muestra) tambin tiene su generalizacin mediante la varianza de la
variable.

La varianza es una medida del grado de concentracin de los valores de la variable aleatoria
alrededor de su media , mientras ms dispersos estn los valores respecto de la media,
mayor ser la varianza. La cual se denota y define de la manera siguiente:

Sea X una variable aleatoria que asume valores x1, x2, x3, , xn con probabilidades P[X = x1],
P[X = x2], P[X = x3], ,P[X = xn], la varianza de X se denota y define

[ ] ( ) [ ] ( ) [ ] ( ) [ ]

La raz cuadrada de la varianza se llama desviacin estndar y se denota .

Ejemplo 5. Vamos calcular la varianza para la variable X que corresponde al nmero de puntos
de la cara superior del dado (Ejemplo 3).

[ ] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

( ) ( )

Estadstica Inferencial Pgina 10


Jorge Luis Bustos Galindo
La desviacin estndares

Propiedades de la varianza

(1) La varianza no pude ser negativa.


(2) Si c es una constante, entonces V[c] = 0.
2 2
(3) V[X] = E[X ] (E[X]) .
2
(4) V[cX] = c V[X], al ser c una constante y X una variable aleatoria.
(5) V[X + c] = V[X], al ser c una constante y X una variable aleatoria.

Ejemplo 6. Una variable aleatoria X tiene distribucin de probabilidad como se indica:

X 0 1 2 3

P[X = x]

Calcule:

(a) E[X 1]
2
(b) E[X ]
(c) E[3X]
2
(d) E[(X + 2) ]
(e) V[X]
(f) V[X+1]
(g) V[5X]

Estadstica Inferencial Pgina 11


Jorge Luis Bustos Galindo
DISTRIBUCIONES DISCRETAS

Distribucin Binomial

La distribucin binomial est ligada a un tipo de experimento llamado ensayo de Bernoulli, en


honor a Jacques Bernoulli (1654-1705).

Un ensayo de Bernoulli es un experimento aleatorio que slo puede concluir de dos maneras
distintas mutuamente excluyentes e independientes. Uno de los resultados se llama xito y el
otro fracaso. Los ensayos de Bernoulli dan origen a una variable aleatoria y toma slo dos
valores, y cuyos valores de probabilidad (distribucin) estn dados por la siguiente frmula:

[ ] {

En donde p corresponde a la probabilidad de que se d o de que ocurra un xito y q = 1 p, la


probabilidad de que ocurra un fracaso.

De las definiciones de valor esperado y de varianza dadas anteriormente, se tiene que para
una variable con distribucin de Bernoulli, su valor esperado es

[ ]

Y su varianza es, [ ] .

Se tiene que la desviacin estndar est dada por,

Un proceso de Bernoulli es una sucesin de ensayos con las caractersticas siguientes:

(1) En cada ensayo, el xito tiene una probabilidad p y el fracaso una probabilidad q = 1
p de ocurrir.
(2) La probabilidad de xito y de fracaso permanece constante durante el proceso.
(3) Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular
no es afectado por el resultado de cualquier otro ensayo.

Suponga que se lleva a cabo un proceso de Bernoulli y sea la variable X = nmero de xitos en
n ensayos de Bernoulli, tiene valores de probabilidad (distribucin), como se indica en la
siguiente frmula:

( )
[ ] {

Siendo p = probabilidad de xito; q = probabilidad de fracaso y

( )
( )

Cuando una variable aleatoria tiene valores de probabilidad dados por la frmula anterior, se
dice que la variable tiene distribucin binomial.

Ejemplo 1. Suponga que el 10% de las partes que produce una mquina automtica sea
defectuoso. Si se toma al azar una muestra de 20 partes, defina la variable que le permita
determinar las probabilidades siguientes:

(a) Que en la muestra haya dos partes defectuosas.


(b) Que en la muestra haya mximo tres partes defectuosas.
(c) Que en la muestra haya 18 partes defectuosas como mnimo.
(d) Que en la muestra haya entre dos y cinco partes defectuosas.
(e) Que en la muestra haya mnimo tres partes defectuosas.

Estadstica Inferencial Pgina 12


Jorge Luis Bustos Galindo
El problema que nos enfrentamos es el de precisar que se va a tomar como xito. Para tal
propsito el xito siempre se tomar como aquel aspecto en el cual centramos nuestra
atencin partes defectuosas, por tanto, al definir la variable, X = nmero de partes
defectuosas, entonces p = 10% = 0.1 y q = 90% =0.9; con una muestra de n=20.

(a) [ ] ( )( ) ( ) ( ) ( )
( )( )
( ) ( )

Hay una probabilidad del 28.5% de que en una muestra de 20 partes, 2 sean defectuosas.

Distribucin Hipergeomtrica

La distribucin binomial se basa en el supuesto de que la poblacin es infinita y de que la


probabilidad de xito permanece constante, lo cual se consigue en tales poblaciones o cuando
se toman muestras con repeticin (reemplazo) en poblaciones finitas. Cuando la poblacin es
finita y el muestreo se hace sin reemplazo, la probabilidad cambiar para cada nueva
observacin. En tales circunstancias, se tendr una distribucin de probabilidad que se llama
distribucin hipergeomtrica.

Para aplicar la distribucin hipergeomtrica, sta debe estar formada por dos grupos de
individuos u objetos. Un primer grupo constituido por aquellos individuos que poseen la
caracterstica objeto de estudio, y su nmero de elementos lo denotaremos como N1 y el otro
estar conformado por los que no poseen la caracterstica y el nmero de sus elementos lo
denotamos N2.

La variable con distribucin hipergeomtrica debe ser de la forma: X = nmero de xitos en los
n ensayos, los valores de probabilidad asociados a esta variable con distribucin
hipergeomtrica estn dados por

( )( )
[ ]
( )
{
Ejemplo 2. Suponga que una empresa produce 100 unidades de las cuales 90 son buenas y
10 son defectuosas. Se escogen 20 unidades sin reemplazo; halle la probabilidad de que
resulten cinco defectuosas.

X = Unidades defectuosas.

N1 = 10 y N2 =90.

( )( )
[ ]
( )

Hay una probabilidad del 2.15% de que en 100 unidades, cinco sean defectuosas.

Distribucin de Poisson

Otra familia de distribuciones de probabilidad, es la llamada distribucin de Poisson, llamada


as por Simeon Dennis Poisson (1781-1840).

Esta distribucin es aplicable a muchos procesos en los que ocurren determinados sucesos por
unidad de tiempo, espacio, volumen, rea, etc.

Estadstica Inferencial Pgina 13


Jorge Luis Bustos Galindo
Una variable con distribucin de Poisson debe tener la estructura o responder los interrogantes
mediante el siguiente planteamiento:

X = nmero de veces que ocurre un suceso en la unidad de tiempo, espacio, volumen, rea,
etc. Los valores de probabilidad de una variable con distribucin de Poisson estn dados por,

[ ] {

En donde promedio de ocurrencia del suceso en la unidad de tiempo, espacio, volumen,


etc. y

Ejemplo 3. Suponga que el nmero de llamadas que llegan a un conmutador es de 0.5 por
minuto en promedio, halle la probabilidad de que:

(a) En un minuto no lleguen llamadas.


(b) En un minuto lleguen ms de tres llamadas.
(c) En tres minutos lleguen ms de dos llamadas.
(d) Cuntas llamadas se espera que lleguen en cinco minutos?

X = nmero de llamadas en un minuto.

( )
(a) [ ]

Hay una probabilidad del 60.65% de que el conmutador no lleguen llamadas.

Estadstica Inferencial Pgina 14


Jorge Luis Bustos Galindo
GUA DE CLASE N 2

1. Se lanza una moneda cuatro veces. Si de los resultados del lanzamiento de la moneda
nos interesa el nmero de sellos que se obtienen en cada lanzamiento, entonces
definimos la variable X: nmero de sellos en los cuatro lanzamientos. Hallar la
distribucin de probabilidad de esta variable aleatoria.
Calcule:
a. E[X]
b. V[X]

2. Una variable aleatoria X tiene distribucin de probabilidad como se indica:


X 0 1 2 3

[ ]

Calcule:
a. E[X + 1]
2
b. E[X ]
c. E[2X]
d. V[X]
e. V[X 1]
f. V[8X]

3. Suponga que cierta poblacin, el 65% de los nacimientos registrados son nias. Si
tomamos tres registros, defina la variable que permita calcular las probabilidades que a
continuacin se piden.
a. Que tres registros corresponda a nias.
b. Menos de dos sean nia.

4. Una caja tiene 15 bateras para radio, de las cuales cinco son defectuosas. De la caja se
escogen al azar seis bateras. Halle la probabilidad de que:
a. Cuatro sean defectuosas.
b. Ninguna sea defectuosa.

5. Se ha determinado que en una autopista se da en promedio 10 animales vagabundos


muertos por kilmetro. Halle la probabilidad de que en 100 metros,
a. Se encuentren dos o ms animales muertos.
b. Menos de tres animales muertos.

6. Si el 5% de los conductores de transmilenio en Bogot, son mujeres. Suponga que se


selecciona al azar 10 conductores para una encuesta acerca de las condiciones de trabajo.
Cul es la probabilidad:
a. Que dos conductores sean mujeres?
b. Menos de dos sean mujeres?

7. Una caja tiene 20 bombillos, de las cuales cinco son defectuosos. De la caja se escogen al
azar diez bombillos. Halle la probabilidad de que:
a. Tres sean defectuosos.
b. Ninguna sea defectuoso.

8. El promedio de personas que llegan a la ventanilla de un banco por minuto durante las
horas hbiles es una. Halle la probabilidad de que en un minuto:
a. No aparezcan clientes.
b. Haya tres o ms clientes.

Estadstica Inferencial Pgina 15


Jorge Luis Bustos Galindo
9. Una institucin universitaria establece nuevos mtodos de aprendizaje y de evaluacin, con
el resultado donde el 85% de sus estudiantes aprueban todas las asignaturas. Supongamos
que se seleccionan 8 estudiantes de dicho plantel, cul es la probabilidad:
a. Exactamente tres aprueben todas las asignaturas?
b. Por lo menos dos aprueben todas las asignaturas?

10. El nmero de clientes que llegan a una corporacin de ahorro y vivienda los das sbados
es en promedio 40 por hora. Cul es la probabilidad de que lleguen por lo menos dos
clientes en media hora?

11. En la produccin de cierto artculo, se sabe que por cada 50 producidos en 30 su


terminado es excelente. Si se toma una muestra de 20 artculos, cul es la probabilidad
de que diez sean clasificados excelentes?

Estadstica Inferencial Pgina 16


Jorge Luis Bustos Galindo
DISTRIBUCIN CONTINUA

DISTRIBUCIN NORMAL

Una de las distribuciones continas y tal vez la ms importante es la distribucin normal, la cual
ocupa un lugar destacado en la inferencia estadstica. Su grfica, que recibe el nombre de
curva normal, es la curva en forma de campana , la cual describe de forma aproximada muchos
fenmenos que suceden en la naturaleza, tales como la estaturas de los seres humanos, el
coeficiente intelectual de las personas, la industria y la investigacin. Adems, los errores en
las mediciones cientficas se aproximan hasta lmites extremadamente pequeos gracias a la
distribucin normal. A las anteriores consideraciones podemos agregar otra que nos muestra el
porqu de la importancia de la distribucin normal; se refiere al aspecto de inferencia
estadstica y particularmente a lo que tiene que ver con el anlisis de datos, puesto que las
distribuciones de muchas estadsticas muestrales tienden a la distribucin normal, conforme
crece el tamao de muestra.

Los valores de probabilidad de eventos definidos mediante una variable aleatoria continua se
mantiene mediante valores de integrales definidas de una funcin llamada funcin de densidad
continua (rea bajo la curva). Al ser la normal una variable de tipo continuo, debe tener una
funcin de densidad que nos permita obtener valores de probabilidad relacionados con esta
variable.

La funcin de densidad de la variable aleatoria X, con media y varianza , es

( )
( )
( )

Cuando nos referimos a una variable aleatoria con distribucin normal con media y varianza
, lo denotamos de la siguiente manera ( ).

La dificultad que se encuentra al resolver las integrales de las funciones de densidad normal
hace necesaria una tabulacin de las reas de la curva normal para una referencia rpida. No
obstante sera una tarea de nunca acabar elaborar una tabla para cada valor posible de y de
. Afortunadamente, es posible transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de observaciones de una variable aleatoria normal Z,
con media cero y varianza 1. Esto puede realizarse por medio de la transformacin: .

La distribucin de una variable aleatoria con media cero y varianza 1, se llama distribucin
normal estndar. Se denota Z ( ).
( ) Z ( )

TRANSFORMACIN

Estadstica Inferencial Pgina 17


Jorge Luis Bustos Galindo
Se ha reducido ahora el nmero requerido de tablas de las reas de la curva normal a slo
una, la distribucin normal estndar (Tabla I), Pgina 51.

A continuacin se ilustra grficamente como obtener los valores de probabilidad, segn las
siguientes situaciones.

(1) P[Z < z] = valor de probabilidad de tabla

Ejemplo 1. P[Z < 1.23] = 0.8907

(2) P[Z > z] = 1 P[Z z]

Ejemplo 2. P[Z > 0.42] = 1 P[Z 0.42]


= 1 0.6628
= 0.3372

(3) P[Z z] = 1 P[Z < z]

Ejemplo 3. P[Z 1.23] = 1 P[Z < 1.23]


= 1 0.8907
= 0.1093

(4) P[Z > z] = P[Z < z]

Ejemplo 4. P[Z > 2.3] = P[Z < 2.3]


= 0.9893

Estadstica Inferencial Pgina 18


Jorge Luis Bustos Galindo
(5) P[Z z] = 1 ; cuando z 3.60.

Ejemplo 5. P[Z 4.0] = 1

(6) P[z1 Z z2] = P[Z z2] P[Z z1]

Ejemplo 6. P[1.3 Z 2.5] = P[Z 2.5] P[Z 1.3]

= 0.9938 0.9032
= 0.0906

Ejemplo 7. P[1.24 < Z < 2.3] =

En algunos casos lo que nos interesa es calcular el valor de zt (valor de z de tabla) que
satisfaga P[Z zt] = valor de probabilidad de tabla. En este caso el proceso es a la inversa.

Ejemplo 8. Encuentre el valor de zt, que tiene una probabilidad de 0.9732.

P[Z Zt] = 0.9732, teniendo en cuenta el valor de probabilidad, podemos ver (Tabla II) que el
valor de zt = 1.93.

Ejemplo 9. Encuentre el valor de zt, para P[Z zt] = 0.3707

Estadstica Inferencial Pgina 19


Jorge Luis Bustos Galindo
Aplicaciones de la distribucin normal

Ejemplo 1. Suponga que ( ), encuentre la probabilidad de que asuma:

(a) Un valor menor que 66.


(b) Un valor entre 45 y 62.
(c) Un valor mayor que 71.

Solucin:

Como la variable ( ), por lo tanto , y .

(a) Para dar solucin a la P[X 66], es necesario realizar la transformacin llamada
estandarizacin, con la cual se obtiene el valor de z.

Calculando la probabilidad tenemos,


P[X 66] = P[Z 1.6] = 0.9452.

Ejemplo 2. Una fbrica de alimentos empaca productos cuyos pesos estn normalmente
distribuidos con media de 450 gramos y desviacin estndar de 20 gramos. Encuentre la
probabilidad de que un paquete escogido al azar pese entre 425 y 486 gramos.

Solucin:
Para este problema tenemos que gramos y gramos, por lo tanto debemos
calcular P[425 X 486].

Estandarizando, tenemos:

P[425 X 486] = P[1.25 Z 1.8]


= P[Z 1.8] P[Z 1.25]
= P[Z 1.8] (1 - P[Z 1.25])
= 0.9641 (1 0.8944)
= 0.8585

Hay una probabilidad del 85.85% de que un paquete escogido al azar pese entre 425 y 486
gramos.

Estadstica Inferencial Pgina 20


Jorge Luis Bustos Galindo
Ejemplo 3. En un examen la calificacin promedio fue 3.5 y la desviacin estndar 0.3. Las
calificaciones siguen una distribucin normal. Qu porcentaje de estudiantes tuvo notas por
debajo de 2.0?Qu porcentaje de estudiantes obtuvo notas por encima de 4.0?

Solucin:

Para este problema tenemos que y , por lo tanto debemos calcular P[X < 2.0] y
P[X > 4.0], estandarizamos tenemos
,
Para las preguntas tenemos,
P[X < 2.0] = P[Z < 5] y P[X > 4.0] = P[Z > 1.67]
= 1 P[Z 5] = 1 P[Z 1.67]
=11 = 1 0.9525
=0 = 0.0475
hay una probabilidad del 0% de que los estudiantes obtengan una nota menor de 2.0 y del
4.75% de que obtengan una nota mayor a 4.0.

Estadstica Inferencial Pgina 21


Jorge Luis Bustos Galindo
GUA DE CLASE N 3

1. Dada una distribucin normal, encuentre el rea bajo la curva que cae:
a. A la izquierda de z = 1.52
b. A la derecha de z = 0.9
c. Entre 1.8 y 2.7
d. A la izquierda de z = 1.93

2. Encuentre el valor z si el rea bajo la curva estndar:


a. A la derecha es 0.3510
b. Entre 0 y z, con z 0, es 0.4838
c. A la izquierda es 0.1234
d. Entre z y z, con z 0, es 0.95

3. Sea X N(100, 225). Halle las probabilidades siguientes:


a. P[X 92.5]
b. P[X 76 ]
c. P[77.5 X 100]

4. Para la variable definida en el problema 3, halle el valor x que satisface:


a. P[X x] = 0.75
b. P[X x] = 0.10
c. P[X x] = 0.05
d. P[ x X x] = 0.90

5. Suponga un test normal de puntuacin media de 75 y una desviacin estndar de 6, tres


estudiantes A, B y C fueron notificados de tener puntuaciones Z normales estndares de
1.8, 0.5 y 0.8 respectivamente. Halle las notas obtenidas por A, B y C.

6. Una fbrica de harina empaqueta en sacos de tela. El saco de harina se acepta como de
distribucin normal con media y desviacin estndar iguales a 25 y 0.5 respectivamente. Si
se toma al azar un saco, cul es la probabilidad de que:
a. Pese cuando ms 24.75?
b. Pese por lo menos 26.25?

7. Una mquina despachadora de refrescos est ajustada para servir en promedio 200
mililitros por vaso. Si la cantidad de refrescos es normalmente distribuidas con una
desviacin estndar igual a 15 mililitros.
a. Qu fraccin de los vasos contendr ms de 224 mililitros?
b. Cul es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c. Cuntos vasos probablemente se derramarn si se utilizan vasos de 230 mililitros en
los siguientes 1000 refrescos?
d. Bajo qu valor se obtiene el 25% ms pequeo de los refrescos?

8. La vida til de cierta marca de batera para automvil se admite con distribucin normal con
media = 38 meses y desviacin estndar = 2 meses. Si la compaa no desea
reemplazar ms del 5% de las bateras vendidas, qu tiempo de garanta debe ofrecer?

9. Los estudiantes de cierta escuela secundaria tiene un coeficiente intelectual promedio de


106 y varianza 256. Al suponer la distribucin normal, halle la proporcin de estudiantes con
coeficiente intelectual.
a. Igual o menor que 98.
b. Igual o menor que 130.
c. Igual o mayor que 127.
d. Entre 94 y 118.

Estadstica Inferencial Pgina 22


Jorge Luis Bustos Galindo
MUESTREO
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir
de una poblacin.
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a
la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a
los que se alcanzaran si se realizase un estudio de toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado
(que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los mrgenes
de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca
podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero
s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se
puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se
pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada
muestra su probabilidad de extraccin, sigue la llamada distribucin muestral.

Tcnicas de muestreo estadstico


Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de
juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin).
Cuando este ltimo cumple con la condicin de que todos los elementos de la poblacin tienen
alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada
sujeto de la poblacin es conocida de antemano, recibe el nombre de muestreo probabilstico.
Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa
para decidir cmo tomar una muestra aleatoria ms adelante.

Muestreo probabilstico
Forman parte de este tipo de muestreo todos aquellos mtodos para los que puede calcular la
probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas
de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. En este
caso se habla de muestras probabilsticas, pues no es en rigor correcto hablar de muestras
representativas dado que, al no conocer las caractersticas de la poblacin, no es posible tener
certeza de que tal caracterstica se haya conseguido.
Sin reposicin de los elementos: Cada elemento extrado se descarta para la subsiguiente
extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de bombillas para estimar
la vida media de las bombillas que la integran, no ser posible medir ms que una vez la
bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con remplazamiento de los
individuos, de forma que la poblacin es idntica en todas las extracciones. En poblaciones
muy grandes, la probabilidad de repetir una extraccin es tan pequea que el muestreo puede
considerarse con reposicin aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una
extraccin es tan pequea que el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin
de nmeros aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. Pero
no es exacto

Muestreo aleatorio simple (MAS)

Es aquel en que cada elemento de la poblacin tiene la misma probabilidad de ser


seleccionado para integrar la muestra. Cada uno de los elementos de la muestra, se
selecciona aleatoriamente uno por uno.

Existen dos formas de realizar el muestreo:

Estadstica Inferencial Pgina 23


Jorge Luis Bustos Galindo
Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado ms de una
vez en la muestra para ello se extrae un elemento de poblacin se observa y se devuelve a la
poblacin, por lo que esta forma se pueden hacer infinitas extracciones de la poblacin aun
siendo esta finita.

Muestreo sin reemplazo: No se devuelve los elementos extrados a la poblacin hasta que no
se hallan extrados todos los elementos que conforman la muestra.

Hay diversos procedimientos para extraer los individuos de una muestra aleatoria:

Una de ellas consiste en realizar un sorteo aleatorio con papeles o bolas enumeradas y sacar
uno a uno tantos como lo indique el tamao de la muestra. Otra forma, es utilizar la tabla de
nmeros aleatorios pero solamente para poblaciones finitas, la utilizacin de estas tablas
puede realizarse de diferentes modos.

Tambin se puede encontrar un intervalo constante ( ), para escoger a cada individuo de la


muestra seleccionada; por ejemplo, en una institucin educativa tienen 90 estudiantes en el
grado undcimo y se desea extraer una muestra de 30 estudiantes. En primer lugar se
numeran los estudiantes del 1 al 90, luego se calcula el intervalo constante entre cada individuo
, se sortea un nmero al azar del 1 al 3, supongamos que el 2, los siguientes
estudiantes se obtienen 3 hasta llegar los 30 estudiantes de la muestra, teniendo as los
estudiantes seleccionados son: 2, 5, 8, 11,, 89.

Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).
Luego hay que calcular una constante, que se denomina coeficiente de elevacin K= N/n;
donde N es el tamao del universo y n el tamao de la muestra. Determinar en qu fecha se
producir la primera extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah
en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener
en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N)
y queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n),
dividimos el nmero de la poblacin por el nmero de la muestra que queremos tomar y el
resultado de esta operacin ser el intervalo, entonces escogemos un nmero al azar desde
uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el
orden.

Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de
estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo
que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo
sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los
estratos, existen dos tcnicas de muestreo estratificado:

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al


tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms


variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos,
puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55% de mujeres

Estadstica Inferencial Pgina 24


Jorge Luis Bustos Galindo
y un 45% de hombres, se tomara una muestra que contenga tambin esos mismos
porcentajes de hombres y mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados
con este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o
estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean
homogneas respecto a la caracterstica en cuestin.

Muestreo por estadios mltiples


Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de
referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene
una muestra con unidades distribuidas de tal forma que resultan de difcil acceso. En el
muestreo a estadios mltiples se subdivide la poblacin en varios niveles ordenados que se
extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla
en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas
determinado, stos pueden subdividirse en unidades primarias representadas por
circunscripciones didcticas y unidades secundarias que seran los propios profesores. En
primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la
lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra
de unidades secundarias de cada una de las primarias seleccionadas en la primera extraccin.

Muestreo por conglomerados


Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se
supone que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente
respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos
o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las
personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las unidades, es
decir, los miembros del grupo, o slo se le podra aplicar a algunos de ellos, seleccionados al
azar. Este mtodo tiene la ventaja de simplificar la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para
integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo
funciona mejor cuanto ms homognea es la poblacin respecto del estrato, aunque ms
diferentes son stos entre s. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre s.

Homogeneidad de las poblaciones o sus subgrupos


Homogneo significa, en el contexto de la estratificacin, que no hay mucha variabilidad. Los
estratos funcionan mejor cuanto ms homogneos son cada uno de ellos respecto a la
caracterstica a medir. Por ejemplo, si se estudia la estatura de una poblacin, es bueno
distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya
menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas
diferencias entre unas estaturas y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas
diferencias dentro del estrato que en toda la poblacin, no hay por qu usar este mtodo de
muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la
poblacin, lo que se construyen son conglomerados, que ahorran algo del trabajo que
supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan
bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo
respecto a la caracterstica a estudiar y los conglomerados, si representan fielmente a la
poblacin, esto es, contienen toda su variabilidad, o sea, son heterogneos.

Estadstica Inferencial Pgina 25


Jorge Luis Bustos Galindo
Muestreo no probabilstico
Es aqul para el que no puede calcularse la probabilidad de extraccin de una determinada
muestra. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento
profundo del tema bajo estudio, por lo tanto, se considera que la informacin aportada por esas
personas es vital para la toma de decisiones.

Muestreo por cuotas


Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En
primer lugar es necesario dividir la poblacin de referencia en varios estratos definidos por
algunas variables de distribucin conocida (como el gnero o la edad). Posteriormente se
calcula el peso proporcional de cada estrato, es decir, la parte proporcional de poblacin que
representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para
determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que
una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra
dentro de cada estrato.

Muestreo de bola de nieve


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en
contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a partir de los
propios entrevistados. Partiendo de una pequea cantidad de individuos que cumplen los
requisitos necesarios estos sirven como localizadores de otros con caractersticas anlogas.

Muestreo subjetivo por decisin razonada


En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas
de manera racional y no casual. Una variante de esta tcnica es el muestreo compensado o
equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra
para determinadas variables se acerque a la media de la poblacin. La cual funciona en base a
referencias o por recomendacin.

Estadstica Inferencial Pgina 26


Jorge Luis Bustos Galindo
TAMAO DE MUESTRA
El tamao de la muestra que debemos escoger para hacer una estimacin del parmetro con
las caractersticas especificadas (nivel de confianza y error de estimacin) es un problema que
tarde o temprano tenemos que resolver. La determinacin el tamao de la muestra es de
importancia debido a que:
Si se toma una muestra ms grande de lo indicada para alcanzar los resultados
presupuestados, constituye un desperdicio de recursos (tiempo, dinero, etc.).
Al tomar una muestra demasiado pequea conduce a menudo a resultados poco confiables.
Cuando elegimos una muestra de tamao n slo revisamos una fraccin o parte de la
poblacin y con base en ella tomamos decisiones que afectan a toda la poblacin. Es
evidente que este procedimiento existe una posibilidad de que nos equivoquemos en
nuestras decisiones, pero esta posibilidad depende en gran medida del tamao de muestra
de la poblacin que se haya escogido y por tanto analizado.
El tamao que debe tener la muestra cuando se estima la media o proporcin depende del
nivel de confianza propuesto para el intervalo, as como el mximo error que estemos
dispuestos a admitir entre el valor estimado y el valor real del parmetro que corresponde al
error de estimacin.
1. Tamao de muestra con varianza poblacional conocida.
1.1 Poblacin infinita o muestreo con repeticin
Supongamos que hemos fijado en d el error de estimacin (precisin) y el nivel de confianza de
( ) para la estimacin de la media de una poblacin normal con varianza
desconocida, siendo as, tenemos la ecuacin,

( )

De la ecuacin anterior, se tiene

Ejemplo 1. Un ingeniero trata de ajustar una mquina dispensadora de gaseosas de tal forma
que el promedio del lquido dispensado se encuentra dentro de cierto rango. Sabe que la
cantidad de lquido vertida por la mquina sigue una distribucin normal con una desviacin
estndar decilitros. Tambin desea que el valor estimado que vaya a obtener de la
media comparado con el verdadero no sea superior a 0.02 decilitros con una confianza del
95%. De qu tamao debe escoger la muestra, o sea cuntas mediciones debe realizar para
que cumpla el plan propuesto?
Solucin:
La informacin dada es:
, d=0.02 y un nivel de confianza del 95% por lo tanto, el nivel de significancia
y ( ) .
Reemplazando tenemos,
( ) ( )
( )
mediciones.

El ingeniero tendra que escoger una muestra de 216 mediciones.

1.2. Poblacin finita y muestreo sin repeticin


El tamao de muestra en una poblacin finita est dada por la ecuacin,

( )

Estadstica Inferencial Pgina 27


Jorge Luis Bustos Galindo
Ejemplo 2. Para efectos de una planeacin econmica en cierta zona del pas, es necesario
estimar entre 10 000 establos lecheros, el nmero de vacas lecheras por establo con un error
de estimacin de 4 y un nivel de confianza del 90%. Si se sabe que . Cuntos
establos deben visitarse para satisfacer estos requerimientos?
Solucin:
La informacin dada es:
N=10 000, , d=4 y un nivel de confianza del 90% por lo tanto, el nivel de significancia
y .
Reemplazando tenemos,
( )( ) ( )
( )( ) ( ) ( )
establos.

Se debe visitar a 166 establos.

2. Tamao de muestra proporcional a la poblacin

2.1. Poblacin infinita o muestreo con repeticin


Cuando es el caso de tomar el tamao de una muestra proporcional a una poblacin infinita o
un muestreo con repeticin, utilizaremos la frmula,
( )

En donde corresponde a la proporcin estimada, d el error de estimacin. Cuando no se da


estimacin alguna de , el clculo de la muestra se hace tomando a . Esto arroja por
lo general una muestra mucho mayor de la indicada, pero es el precio que debemos pagar por
no tener mayor informacin sobre el caso.
Ejemplo 3. Se est planeando una encuesta con el fin de determinar la proporcin de familias
que carecen medios econmicos para atender los problemas de salud. Existe la impresin de
que esta proporcin est prxima a 0.35. Se desea determinar un intervalo de confianza del
99% con un error de estimacin de 0.05. De qu tamao debe tomarse la muestra?
Solucin:
La informacin dada es:
, d=0.05, un nivel de confianza del 99% por lo tanto, el nivel de significancia y
.
Reemplazando tenemos,
( ) ( )( )
( )
familias.

Se debe encuestar a 603 familias.

2.2 Poblacin finita y muestreo sin repeticin


Si el tamao de la poblacin debe ser tenido en cuenta el tamao de muestra est dado por
( )
( ) ( )
Ejemplo 4. El decano de una facultad desea realizar una encuesta para determinar la
proporcin de estudiantes que est a favor del cambio de sede. Ya que entrevistar a 2000
estudiantes es una tarea casi imposible, determine el tamao de muestra necesario para
estimar la proporcin de estudiantes que estn a favor, con un error de estimacin de 0.05 y
un nivel de confianza del 95%.

Estadstica Inferencial Pgina 28


Jorge Luis Bustos Galindo
Solucin:
La informacin dada es:
N=2000, como se desconoce la proporcin, entonces , d=0.05, un nivel de confianza del
95% por lo tanto, el nivel de significancia y .
Reemplazando tenemos,
( )( ) ( )( )
( )( ( ) ( )( )
estudiantes.
)

Por lo tanto, debe entrevistar a 322 estudiantes.

GUA DE CLASE N 4

1. Suponga que las estaturas de los hombres tienen distribucin normal con desviacin
estndar de 2.5 pulgadas. De qu tamao se debe tomar la muestra si se desea
determinar un intervalo de confianza del 95% para una media con un error de estimacin de
0.5?

2. Un qumico ha preparado un producto diseado para matar el 80% de un tipo particular de


insectos, de qu tamao se debe escoger la muestra para estimar la verdadera proporcin
si se requiere un intervalo de confianza del 95% y un error de estimacin del 2%?

3. Un tcnico desea determinar el tiempo promedio que los operarios tardan en preparar sus
equipos. Qu tamao debe tener la muestra si se necesita una confianza del 95% de que
su media muestral estar dentro de 15 segundos del promedio real? Suponga que por
estudios anteriores se sabe que segundos.

4. Se desea estimar el peso promedio de un lote de 500 naranjas. Para ello se va escoger
aleatoriamente cierto nmero de naranjas. Se desea que el error de estimacin sea mximo
de 2 onzas con un nivel de confianza del 90%. Cuntas naranjas deben seleccionarse?
Suponga que .

5. Se desea estimar la proporcin de estudiantes que estn a favor de la legalizacin de las


drogas prohibidas. El error de estimacin se requiere del 1% y un nivel de confianza del
99%. Cuntos estudiantes deben incluirse en la muestra?

6. Se desea estimar la fuerza promedio para levantar a un nio de seis aos. Como no se
tena informacin sobre la varianza de esta poblacin se procedi a tomar una muestra
piloto para estimarla; los resultados fueron los siguientes: 2.24, 2.26, 2.47, 1.56, 1.72, 1.48,
2.40, 2.03, 1,72, 2.10, 1.74, 1.55. Si se desea estimar un intervalo del 95% de confianza con
un error de estimacin de 0.1. De qu tamao se debe escoger la muestra?

7. El jefe de personal de una empresa desea realizar una encuesta para determinar la
proporcin de trabajadores que est a favor de un cambio del horario de trabajo. Como es
imposible consultar a los 500 trabajadores en un lapso razonable, procede a escoger
aleatoriamente cierto nmero de trabajadores para entrevistarlos; determine el nmero de
trabajadores que debe entrevistarse si se desea que la proporcin estimada presente un
error mximo del 5% y un nivel de confianza del 95%.

Estadstica Inferencial Pgina 29


Jorge Luis Bustos Galindo
PRUEBAS DE HIPTESIS
Dentro de la inferencia estadstica, una prueba de hiptesis (tambin denominado test de
hiptesis o prueba de significacin) es un procedimiento para juzgar si una propiedad que
se supone en una poblacin estadstica es compatible con lo observado en una muestra de
dicha poblacin. Fue iniciada por Ronald Fisher y fundamentada posteriormente por Jerzy
Neyman y Karl Pearson.
Mediante esta teora, se aborda el problema estadstico considerando una hiptesis nula
( ) y una hiptesis alternativa ( ), y se intenta averiguar cul de las dos es la hiptesis
verdadera, tras aplicar el problema estadstico a un cierto nmero de experimentos.
Est fuertemente asociada a los considerados errores de tipo I y II en estadstica, que definen
respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero
como falso.
Existen diversos mtodos para desarrollar dicho test, minimizando los errores de tipo I y II, y
hallando por tanto con una determinada potencia, la hiptesis con mayor probabilidad de ser
correcta. Los tipos ms importantes son los test centrados, de hiptesis y alternativa simple,
aleatorizados, etc. Dentro de los test no paramtricos, el ms extendido es probablemente
el test de la U de Mann-Whitney.

Planteamiento clsico del contraste de hiptesis

Se denomina hiptesis nula a la hiptesis ( ) que se desea contrastar. El nombre de "nula"


significa sin valor, efecto o consecuencia, lo cual sugiere que ( ) debe identificarse con la
hiptesis de no cambio (a partir de la opinin actual); no diferencia, no mejora,
etc. ( ) representa la hiptesis que mantendremos a no ser que los datos indiquen su
falsedad, y puede entenderse, por tanto, en el sentido de neutra. La hiptesis ( ) nunca se
considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de
que dos poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas
difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no
puede ser "demostrada" mediante muestreo, puesto que siempre cabe la posibilidad de que las
medias difieran en una cantidad lo suficientemente pequea para que no pueda ser
detectada, aunque la muestra sea muy grande.
A partir de una muestra de la poblacin en estudio, se extrae un estadstico (esto es, una valor
que es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la
hiptesis en estudio y sea conocida. Se toma entonces como regin de rechazo al conjunto de
valores que es ms improbable bajo la hiptesis, esto es, el conjunto de valores para el que
rechazaremos la hiptesis nula si el valor del estadstico observado entra dentro de l.
La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo
an siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger dicha
regin de tal forma que la probabilidad de cometer este error sea suficientemente pequea.
Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la poblacin es el
conjunto de los treinta lanzamientos a realizar, el estadstico escogido es el nmero total de
caras obtenidas, y la regin de rechazo est constituida por los nmeros totales de caras
iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda est
trucada a pesar de que no lo est es igual a la probabilidad binomial de tener 25 "xitos" o ms
en una serie de 30 ensayos de Bernoulli con probabilidad de "xito" 0,5 en cada uno, entonces:
0,0002, pues existe la posibilidad, aunque poco probable, que la muestra nos d ms de 25
caras sin haber sido la moneda trucada.

Procedimientos de prueba
Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se
rechaza .
Ejemplo 1. El ingeniero de control de calidad de una fbrica de tornillos tiene la sospecha de
que el proceso de produccin de tales tornillos no se est cumpliendo la especificacin en
cuanto la longitud promedio que debe ser de 5 cm, y que sta, por el contrario, es menor. Si

Estadstica Inferencial Pgina 30


Jorge Luis Bustos Galindo
ello es as, ser necesario detener la produccin para hacer los ajustes del caso. Como
podemos apreciar en este caso, la decisin que se tome traer sus consecuencias; por ello se
debe ser consciente al tomar la decisin. En la consideracin anterior podemos apreciar dos
posibilidades la hiptesis estadstica, constituidas por:
La proposicin o afirmacin que el ingeniero espera aceptar, denominada , y denominada
hiptesis alterna. En nuestro caso esta hiptesis corresponde a la afirmacin: La longitud
media de los tornillos es menor de 5 cm. Simblicamente la denotaremos , siendo
longitud promedio de los tornillos.
La proposicin que el ingeniero espera rechazar, denotada , llamada hiptesis nula, que
en el presente caso corresponde a la afirmacin: La longitud promedio de los tornillos es de
5 cm. Simblicamente la denotaremos .
Las dos anteriores hiptesis se escriben conjuntamente de la manera siguiente:

La escritura nos indica que existe una confrontacin de afirmaciones y slo la evidencia de los
datos nos podr indicar hacia dnde debemos inclinarnos, lo que no requiere decir que queda
demostrada, sino que no queda validada ante la evidencia de la muestra. Esto hay que tenerlo
en cuenta porque olvidarlo o desconocerlo da origen a las muchas conclusiones erradas que se
hacen y que motivan una crtica injustificada a las conclusiones con base en la inferencia
estadstica.

Un procedimiento de prueba se especifica por lo siguiente:

1. Un estadstico de prueba: una funcin de los datos muestrales en los cuales se basa la
decisin de rechazar o no rechazar .
2. Una regin de rechazo, el conjunto de todos los valores del estadstico de prueba para los
cuales ser rechazada.
Entonces, la hiptesis nula ser rechazada si y solo si el valor observado o calculado del
estadstico de prueba se ubica en la regin de rechazo.
La regin de aceptacin es un conjunto de valores, determinado bajo ciertas reglas, tal que si el
valor de la estadstica de prueba cae dentro, la hiptesis nula se declara no contraria al valor
de la estadstica (esto no significa que sea verdadera sino que su falsedad no ha sido
probada). La regin de rechazo, tambin llamada regin crtica, es un conjunto de valores
distinto a los anteriores; si la estadstica de prueba asume un valor que est dentro, la hiptesis
nula se declara contraria a la evidencia de la muestra y por lo tanto debe ser rechazada.
El valor crtico es aquel nmero que separa la regin de aceptacin de la regin de rechazo.
As por ejemplo, si la regla de decisin es rechazar si , entonces 5 es un valor
crtico.
Rechazo Aceptacin

5
Cuando la regin de rechazo est localizada en un solo extremo de la curva de la distribucin
de la estadstica de prueba, la prueba se dice de una cola. Cuando la regin de rechazo est
localizada en ambos extremos la prueba se dice de dos colas.
Si se trata de una prueba de una media para poblacin normal, las distintas pruebas respecto
de las posibilidades para la hiptesis alterna son:
1. .

Zona de rechazo
( )

Prueba de una cola a la derecha.

Estadstica Inferencial Pgina 31


Jorge Luis Bustos Galindo
2. .

Zona de rechazo
( )

Prueba de una cola a la izquierda

3. .

Zona de rechazo Zona de rechazo


( ) ( )

Prueba de dos colas


En los casos anteriores la hiptesis nula tambin puede formularse como , para el
caso 1, y para el caso 2. Sin embargo, en los clculos siempre se tomar .
En el mejor de los casos podran desarrollarse procedimientos de prueba para los cuales
ningn tipo de error es posible. Pero esto puede alcanzarse solo si una decisin se basa en un
examen de toda la poblacin, lo que casi nunca es prctico. La dificultad al usar un
procedimiento basado en datos muestrales es que debido a la variabilidad en el muestreo
puede resultar una muestra no representativa.
Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error
es pequea. La eleccin de un valor particular de corte de la regin de rechazo fija las
probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por y ,
respectivamente.

Errores en el contraste
Una vez realizado el contraste de hiptesis, se habr optado por una de las dos
hiptesis, o , y la decisin escogida coincidir o no con la que en realidad es cierta. Se
pueden dar los cuatro casos que se exponen en el siguiente cuadro:

Decisin
Estado de naturaleza
Aceptar Descartar
es cierta Accin correcta Error de tipo I
( ) ( )
es falsa Error d tipo II Accin correcta
( ) ( )

Si la probabilidad de cometer un error de tipo I est unvocamente determinada, su valor se


suele denotar por la letra griega , y en las mismas condiciones, se denota por la
probabilidad de cometer el error de tipo II, esto es:
( )
( )
En este caso, se denomina Potencia del contraste al valor 1-, esto es, a la probabilidad de
escoger cuando sta es cierta

Estadstica Inferencial Pgina 32


Jorge Luis Bustos Galindo
( )
Cuando es necesario disear un contraste de hiptesis, sera deseable hacerlo de tal manera
que las probabilidades de ambos tipos de error fueran tan pequeas como fuera posible. Sin
embargo, con una muestra de tamao prefijado, disminuir la probabilidad del error de tipo I, ,
conduce a incrementar la probabilidad del error de tipo II, .
Ejemplo 2. En un procedimiento judicial, cuando se acusa a alguien de un asesinato, cuando
se llama a juicio se presume que el acusado es inocente, es decir, no culpable hasta que se
demuestra lo contrario. El error tipo I corresponde al caso de condenar a un inocente y el error
tipo II al dejar libre a un culpable.
Cuando tomamos decisiones con base en los datos muestrales, cualquier cosa puede ocurrir,
desde lo ms grave (cometer el error tipo I) hasta lo ms acertado (tomar una decisin
correcta), y aun lo menos grave que sera cometer el error tipo II. Ante la gravedad de cometer
el error tipo I y ante la imposibilidad de descartarlo, la nica alternativa que nos queda es la
asignarle una probabilidad, obviamente pequea, de que ste ocurra; llegamos de esta manera
al concepto de nivel de significancia.
El nivel de significancia de una prueba corresponde a la probabilidad de cometer el error tipo
I. Es decir, es la probabilidad de rechazar siendo verdadera. Esta probabilidad se denota
con la letra y corresponde al rea de rechazo; de tal forma que se igualar al total del rea
derecha o izquierda, si se trata de pruebas de una cola o se repartir en partes iguales entre
las dos colas, si se trata de una prueba bilateral.
Usualmente, se disean los contrastes de tal manera que la probabilidad sea el 5% (0,05),
aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones ms relajadas o
ms estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir ,
probabilidad de error de tipo II, es aumentar el tamao muestral, lo que en la prctica conlleva
un incremento de los costes del estudio que se quiere realizar.

Pasos en una prueba de hiptesis


Primer paso. Formular la hiptesis o asegurar que es verdadera. Esta formulacin puede ser
literal, pero generalmente traducida en trmino de parmetros ( ).
Segundo paso. Establecer el tamao de muestra (n) y el nivel de significancia ( ).
Tercer paso. Determinar una estadstica de prueba o una regla que sea lgica en el contexto
del problema formulado por la hiptesis. La estadstica de prueba proporciona un nmero a
partir de los datos muestrales.
Cuarto paso. Formular una regla de decisin. Esto es, definir la posicin que se asumir para
cada resultado posible del experimento. La regla de decisin debe especificar qu valores de la
estadstica de prueba se toman para aceptar y cuales para rechazarla.
Quinto paso. Recolectar los datos mediante algn procedimiento de muestreo y calcular el
correspondiente valor de la estadstica de prueba.
Sexto paso. Aplicar la regla de decisin. Si el valor de la estadstica de prueba cae en la regin
de rechazo, entonces rechazamos ; si el valor cae en la regin de aceptacin, entonces no
rechazamos o mejor dicho, no hay evidencia para rechazarla.
El rechazo o no rechazo de la hiptesis nula conduce a una decisin clnica, administrativa,
cientfica, etc.

Estadstica Inferencial Pgina 33


Jorge Luis Bustos Galindo
PRUEBAS DE HIPTESIS RESPECTO DE LAS MEDIAS EN POBLACIONES
NORMALES

Es un procedimiento estadstico que nos permite decidir si los datos muestrales son
consistentes o no con algun valor que hemos fijado para la media de una poblacin
normalmente distribuida. Existen dos casos relacionados: cuando la varianza de la poblacin
es conocida y cuando sta es desconocida.

1. Pruebas para una muestra

1.1. Varianza poblacional conocida.


En este caso la prueba estadstica se desarrolla con base en la distribucin normal:
( )

Ejemplo 1. Los siguientes datos corresponden a la longitud medida en centmetros de 18


pedazos de cable sobrantes en cada rollo utilizado: 9.00, 3.41, 6.13, 1.99, 6.92, 3.12, 7.86,
2.01, 5.98, 4.15, 6.87, 1.97, 4.01, 3.56, 8.04, 3.24, 5.05, 7.37. Basados en estos datos,
podemos decir que la longitud media de los pedazos de cables es mayor de 4 cm? Suponga
poblacin normal y tome el nivel de significancia .

Solucin:

Aplicando los pasos de una prueba de hiptesis tenemos:

1. Hiptesis
Longitud promedio de los pedazos de cable.

2. n = 18, .

3. Estadstica de prueba.
( )
( )

4. Regla de decisin.

Se rechaza H0, si .

5. Clculos.

( )

El valor de tabla ( ):

( )

Estadstica Inferencial Pgina 34


Jorge Luis Bustos Galindo
6. Decisin.

Como , entonces se rechaza H0 de que la longitud promedio es menor o igual a 4 cm.

1.2. Varianza poblacional desconocida y muestra pequea.


En este caso se toma como estadstica de prueba a la distribucin t-student:
( )

con (n 1) grados de libertad.

Ejemplo 2. Un agrnomo mide el contenido promedio de humedad en cierta variedad de trigo


que fue secado especialmente en una muestra de 16 toneladas: 7.2, 6.8, 7.3, 7.0, 7.3, 7.3, 7.5,
7.3, 7.4, 7.2, 7.6, 7.1, 7.4, 6.7, 7.4, 6.9. Si el promedio de humedad excede de 7.1, el proceso
de secado debe continuar. Deber continuarse con el proceso de secado, de acuerdo con
esta evidencia? Tome .

Solucin:

1. Hiptesis
contenido promedio de humedad de cada tonelada de trigo.

2. n = 16, .

3. Estadstica de prueba.
( )
( )

4. Regla de decisin.

Se rechaza H0, si .

5. Clculos.

( )

El valor de tabla ( ):
( ) ( )

Estadstica Inferencial Pgina 35


Jorge Luis Bustos Galindo
6. Decisin.

Como , entonces se rechaza H0 de que el promedio de humedad de cada tonelada de


trigo es menor o igual a 7.1, ante esta evidencia el proceso de secado debe continuar.

2. Pruebas para dos muestras independientes

Cuando se trata de pruebas de dos medias relacionadas con poblaciones independientes, las
hiptesis a probar son:

Equivalente a:
. Prueba de una cola a la derecha.

Equivalente a:
. Prueba de una cola a la izquierda.

Equivalente a:
. Prueba de dos colas.
Tambin se tienen en cuenta dos casos, cuando las varianzas de las poblaciones son
conocidas o cuando las varianzas son desconocidas.

Si las varianzas poblacionales son conocidas, se utiliza como estadstica de prueba la variable
con distribucin normal estndar:
( ) ( )

Cuando las varianzas poblacionales son desconocidas pero supuestas iguales con muestras
pequeas, se utiliza como estadstica de prueba a la distribucin t-student:
( ) ( )

con (n1 + n2 2) grados de libertad y donde,
( ) ( )
( )
se llama varianza ponderada.

Ejemplo 3. Mediciones del dimetro transversal del corazn de los adultos del sexo masculino
y femenino dieron los resultados siguientes:

Grupo Tamao de muestra en cm. S en cm.


Hombres 12 13.21 1.05
Mujeres 9 11.00 1.01

Suponga que las varianzas de las dos poblaciones son iguales. Proporcionan estos datos
suficiente evidencia que indique que el dimetro transversal promedio del corazn de los
hombres es igual al de las mujeres? Tome .

Estadstica Inferencial Pgina 36


Jorge Luis Bustos Galindo
Solucin:

1. Hiptesis
dimetro transversal promedio de los hombres.
dimetro transversal promedio de las mujeres.

2. n1 = 12, n2 =9, .

3. Estadstica de prueba.

( ) ( )
( )

4. Regla de decisin.

Se rechaza H0, si .

5. Clculos.

( )( ) ( )( )

( )
( )

El valor de tabla ( ):

( ) ( )

6. Decisin.

Como , entonces se rechaza H0 de que el dimetro transversal promedio del corazn de


los hombres es igual al de las mujeres.

3. Pruebas sobre medias cuando las observaciones son pareadas


Esta prueba aparece cuando por ejemplo, comparamos los pesos de las personas antes y
despus de un tratamiento para bajar peso. La aplicacin de esta prueba requiere que las
unidades que formen la pareja tengan las mismas caractersticas, como sucede en los
siguientes casos:

Estadstica Inferencial Pgina 37


Jorge Luis Bustos Galindo
Los mismos individuos reciben el tratamiento antes y despus.
Las parejas son gemelos que reciben tratamientos distintos.
Dos partes del mismo material son sometidos a tratamientos distintos.
El procedimiento estadstico para analizar el comportamiento de la variable de inters se basa
en la diferencia de las mediciones de las unidades que forman la pareja y es similar al que se
sigue para la prueba de una media al utilizar la distribucin t-student, slo que se toma como
estadstica de prueba a la variable:
( )

con (n 1) grados de libertad.


= diferencia promedio de los datos muestrales, Sd = desviacin estndar de las diferencias.

Ejemplo 4. Diez personas fueron sometidas a un test antes y despus de recibir cierta
instruccin. Los resultados fueron los siguientes:

Individuo 1 2 3 4 5 6 7 8 9 10
Antes 70 84 88 110 105 100 110 67 79 86
Despus 115 148 176 191 158 178 179 140 161 157

Proporcionan estos datos evidencia suficiente para decir que la instruccin fue efectiva?
Tome .

Solucin:

1. Hiptesis

diferencia promedio del test aplicado a diez individuos.

2. n = 10, .

3. Estadstica de prueba.
( )
( )

4. Regla de decisin.

Se rechaza H0, si .

5. Clculos.


( )

El valor de tabla ( ):
( ) ( )

Estadstica Inferencial Pgina 38


Jorge Luis Bustos Galindo
6. Decisin.

Como , entonces se rechaza H0, los datos evidencian que la instruccin fue efectiva.

Estadstica Inferencial Pgina 39


Jorge Luis Bustos Galindo
GUA DE CLASE N 5

1. Una fbrica de pilas garantiza que su producto tiene una vida media de 1000 horas y una
desviacin estndar de 50. Pruebe la hiptesis de que en contraposicin de la
alterna horas, si una muestra aleatoria de 30 bateras tiene una duracin promedio
de 950 horas. Utilice .

2. Una muestra aleatoria de 36 refrescos de una mquina despachadora tiene un contenido


promedio de 19.8 decilitros, con una desviacin estndar de 1.3 decilitros. Pruebe la
hiptesis de decilitros en contraposicin a la hiptesis alterna . Use el nivel de
significancia .

3. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4.22,
3.99, 5.41, 4.23, 4.29, 4.62, 4.55, 4.13, 4.23, 4.48. Evidencian estos datos que el contenido
promedio de grasa en los hombres es menor de 4.464? Considere y tome .

4. Se espera que dos operarios produzcan en promedio el mismo nmero de unidades


terminadas en el mismo tiempo. Los siguientes datos dan los nmeros de las unidades
terminadas para ambos trabajadores en una semana de trabajo.

Operario 1 Operario 2
10 12
9 16
16 16
14 15
11 14

Si supone que el nmero de unidades terminadas diariamente por los trabajadores son
variables aleatorias independientes distribuidas normalmente con varianzas iguales, puede
concluirse alguna diferencia entre las medias? Tome .

5. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194,
202, 335, 515, 184, 369, 142, 552, 200, 344, 421, 590, 301, 439. Podemos concluir que la
distancia promedio en que se aleja es mayor de 338 m? Suponga y tome .

6. Pruebe la hiptesis segn la cual el contenido promedio de un aceite comestible es de 5


litros. Si los contenidos de una muestra aleatoria de 10 recipientes son: 5.2, 4.7, 5.1, 5.3,
5.1, 4.8, 4.9, 5.4, 5.3, 4.8. Utilice un nivel de significancia de y suponga que la
distribucin de los contenidos es normal.

7. Se desea comparar dos mtodos para ensear estadstica. Para ello se tomaron 10 pares
de estudiantes del mismo nivel de aprovechamiento en estadstica. De cada par, a uno se le
asigna al azar el mtodo A y al otro al mtodo B. Despus de un periodo de cuatro
semanas, cada estudiante se someti a un examen, con las puntuaciones siguientes:

Par 1 2 3 4 5 6 7 8 9 10
Mtodo A 36 37 41 42 36 35 42 33 40 38
Mtodo B 35 35 42 41 36 34 40 31 39 37

Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de
aprovechamiento de los mtodos son distintos? Sea .

8. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para resolver un
examen de estadstica.

Grupo Tiempo mnimo


1 100 84 96 107 89
2 79 163 95 132 91 85

Estadstica Inferencial Pgina 40


Jorge Luis Bustos Galindo
Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo
de duracin promedio para responder el examen del grupo 1 es mayor que el promedio del
grupo 2. Tome .

9. Los siguientes datos corresponden a los dimetros de dos muestras de arandelas


producidas por dos mquinas distintas.

Muestra 1 0.91 1.82 1.46 1.95 1.57 1.61 1.32


Muestra 2 1.03 1.99 1.65 2.07 1.66 1.76 1.28 2.01

Considere que los dimetros se distribuyen normalmente y que las varianzas respectivas
son . Evidencian estos datos que los dimetros promedios de las
arandelas producidas por las dos mquinas son iguales? Tome .

10. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron
observados sus pesos al comienzo y al final de la dieta. Estos datos se muestran en la
tabla que sigue:

Individuo 1 2 3 4 5
Peso inicial 295 305 323 299 310
Peso final 251 259 267 265 263

Se puede concluir segn estos datos que la dieta es efectiva? Tome .

11. Suponga que tienen dos poblaciones X y Y independientes, distribuidas normalmente y de


igual varianza. De cada una de estas poblaciones se extrae una muestra. En la tabla que
sigue se dan los resultados:

Poblacin Media Desviacin estndar Tamao de muestra


X 4.52 1.40 5
Y 5.31 1.95 23

Se puede concluir a partir de estos datos, que es mayor de 1?


Tome .

12. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseanza
secundaria media en una ciudad es de 225. Una muestra aleatoria de 25 estudiantes
arroja un coeficiente intelectual de 106. Se puede concluir a partir de estos datos que el
coeficiente intelectual medio de los estudiantes es superior a 100? Tome .

13. Una muestra aleatoria de tamao n1 = 25, tomada de una poblacin normal con desviacin
estndar de , tiene una media . Una segunda muestra aleatoria de tamao
n2 = 36, tomada de una poblacin normal diferente con desviacin estndar , tiene
media . Pruebe la hiptesis de , en contraposicin a la alterna .
Tome .

14. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas
lubricadas con dos aceites comerciales. Los resultados fueron:

Marca 1 Marca2

Considere que se trata de poblaciones normales con igual varianza. Evidencian estos
datos que las potencias promedios son iguales? Tome .

Estadstica Inferencial Pgina 41


Jorge Luis Bustos Galindo
PRUEBAS DE HIPTESIS RESPECCTO DE LAS VARIANZAS EN
POBLACIONES NORMALES

Las pruebas referentes a varianzas pueden ser para una o dos varianzas. Si se trata de una
sola varianza utilizamos como estadstico de prueba la variable con distribucin Ji cuadrado:
( )

y con un valor de tabla ( ): ( ), en donde k = (n 1) grados de libertad y q la medida de


la cola derecha.

Ejemplo 1. Se tom una muestra aleatoria de tamao n= 25 se obtuvo un valor S=150, con
estos datos. Pruebe la hiptesis vs. .

Solucin
1. Hiptesis
vs.

2. n = 25

3. Estadstica de prueba.
( )

4. Regla de decisin.

Se rechaza H0, si .

5. Clculos.
( )( )

El valor de tabla ( ):
( ) ( )

6. Decisin.

36.415 54
Como, entonces rechaza H0.

Cuando se trata de comparar varianzas se utiliza la variable con distribucin F:

Estadstica Inferencial Pgina 42


Jorge Luis Bustos Galindo
En donde y son las varianzas muestrales de las dos poblaciones y con un valor de tabla
(F): ( ( )( )) , con q la medida de la cola derecha, n 1 grados de libertad del numerador y
n2 grados de libertad del denominador.

Se recomienda colocar siempre en el numerador la varianza muestral asociada a la varianza


poblacional mayor. Esto es,
i) Si , entonces el estadstico de prueba se toma como

ii) Si , entonces el estadstico de prueba se toma como .


iii) Si , entonces el estadstico de prueba se toma de tal manera que la mayor de
las variables aparezca en el numerador.

Ejemplo 2. Se compar la eficiencia de dos tipos de aceites para evitar el desgaste en ciertas
piezas sometidas a intenso trabajo. En trece piezas se utiliz el aceite 1 y en otras trece el
aceite 2. Las varianzas muestrales fueron . Pruebe la hiptesis nula segn la
cual las varianzas de las dos poblaciones son iguales. Tome .

Solucin
1. Hiptesis

2. n1 = 13, n2 = 13, .

3. Estadstica de prueba.

4. Regla de decisin.

1/F F
Se rechaza H0, si .

5. Clculos.

El valor de tabla ( ):
( ( )( )) ( ) y
( ( )( )) ( )

6. Decisin.

0.305 3.28 4

Como , entonces rechaza H0, de que las varianzas de las dos poblaciones son iguales.

Estadstica Inferencial Pgina 43


Jorge Luis Bustos Galindo
GUA DE CLASE N 6

1. Se afirma que un dispensador de gaseosas est fuera de control si la varianza de los


contenidos excede de 1.0 decilitros. Si una muestra aleatoria de 16 vasos despachados por
este dispensador dio una varianza muestral de 1.9 decilitros, qu puede decirse del mismo
acerca de si est bajo control? Tome .

2. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribucin normal
con varianza de 1.3 miligramos. Pruebe la hiptesis de que , si una muestra
aleatoria de 8 de estos cigarrillos tiene una desviacin estndar . use .

3. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas
lubricadas con dos aceites comerciales. Los resultados fueron:

Marca 1 Marca2

Proporcionan estos datos una evidencia de que ? Tome .

4. Se compara el nivel de colesterol en la sangre de los pacientes seleccionados al azar y


sometidos a dos dietas distintas; una baja en grasa y la otra normal. Las varianzas y
tamaos de muestra se dan a continuacin:

Baja en grasas
Normal

Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad
de las dos poblaciones de donde se obtuvieron las muestras? Tome .

5. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de
casa de 200 consultadas prefieren la marca A; y que 29 de 150 la marca B. Es esto
evidencia suficiente para sostener que la marca A es preferida a la B? Tome .

6. Se realizo una encuesta para determinar la diferencia que pueda existir entre las fracciones
de casados y solteros entre 20 y 30 aos que fuman. Se entrevistaron 200 personas de
cada grupo y se encontraron 64 casados y 80 solteros que fuman. Contienen los datos
suficiente evidencia que indique que existe una diferencia entre las dos fracciones de
fumadores para las dos poblaciones? Tome .

7. Dos maquinas diferentes A y B se utilizan para producir pernos idnticos que se suponen de
2 pulgadas de longitud. Se toman dos muestras aleatorias de 25 pernos cada una de la
produccin de ambas mquinas Y arrojan dos varianzas pulgadas para la
mquina A, y pulgadas para la mquina B. Evidencian estos datos que las
varianzas son iguales? Tome .

8. La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que


la varianza se ha hecho demasiado grande. Se toma una muestra de 9 partes producidas en
dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas. Pruebe la hiptesis de
que el proceso conserva an la varianza . Tome .

Estadstica Inferencial Pgina 44


Jorge Luis Bustos Galindo
MTODOS NO PARAMTRICOS

Hemos visto en casi todas las pruebas hasta ahora estudiadas permitan que se estimaran
algunos valores desconocidos de los parmetros a partir de valores calculados gracias a
muestras elegidas al azar en una poblacin dada.
Las hiptesis se enunciaban en funcin del valor o valores especificados de los parmetros de
la poblacin.

Como se presentan muchas situaciones en las que no cumplen los supuestos, se han
desarrollado recientemente numerosas pruebas estadsticas que no exigen supuestos
rigurosos acerca de la distribucin de la poblacin y que no requieren enunciar las hiptesis en
trminos de valores especificados de los parmetros, son por consiguiente, pruebas que se
pueden llamar de distribucin libre o no paramtricos. El trmino de distribucin libre describe
un mtodo de probar hiptesis o de definir un intervalo de confianza que no depende de la
naturaleza de la distribucin de la poblacin que se est considerando; el trmino no
paramtrico se utiliza para indicar que no hay hiptesis enunciada en trminos de valores
especificados de parmetros.

No obstante, los mtodos no paramtricos tienen sus ventajas por ser fciles de aplicar. Son
relativamente sencillos, claros de exponer y de comprender en comparacin con los mtodos
paramtricos. De ah que a veces se les llame mtodos abreviados y que se les emplee a
menudo, al aumentar el tamao de la muestra, incluso en situaciones en que se cumplen en
realidad supuestos paramtricos.

En esta gua nos ocuparemos al estudio de algunos mtodos ms frecuentemente empleados.

Prueba de rangos signados


La prueba de signos deja completamente de lado la magnitud de la diferencia entre cada par
de valores. Frank Wilcoxon, en 1945, sugiri un mtodo para mejorar la prueba de signos. sta
mejora, llamada prueba de rangos signados de Wilcoxon, toma en consideracin la magnitud
de las diferencias. Para llevarla a cabo, el primer paso consiste en ordenar todos los valores
absolutos de las diferencias entre observaciones pareadas, del menor al mayor. El rango de la
diferencia ms pequea es entonces 1, el que sigue es 2 y as sucesivamente. Como se asigna
rangos a las diferencias independientemente del signo, por ejemplo a las diferencias -1 y +1 se
les da el mismo rango, es decir, cada diferencia le corresponde un rango y como se omite el
signo entonces ocupara el mismo rango, entonces se promedia los rangos que le corresponde
y ese seria el rango para cada uno de ellos. Una vez ordenadas por rangos las diferencias, se
da a cada rango el signo de la diferencia. Se calculan entonces por aparte la suma de de
rangos positivos y la suma de los rangos negativos y la suma menor omitido el signo, es la
estadstica de prueba que se suele designar por T.

Si la hiptesis nula segn la cual las dos poblaciones tienen idntica distribucin (relativa) es
cierta, podra esperarse que las dos sumas sean aproximadamente iguales, y si las dos sumas
son muy diferentes entre y s, habra que concluir que las dos poblaciones no son idnticas; es
decir, habra que descartar la hiptesis nula.

La estadstica de prueba T se puede emplear para pruebas de una o dos colas. Para de una
cola es necesario anticipar el signo de la suma de los rangos menor, en caso de ser falsa la
hiptesis nula. Si la suma ms pequea tiene signo distinto del que se anticip, no se rechaza
la hiptesis nula.

Ejemplo 1. Suponga que se desea averiguar si un periodo de vacaciones aumentara la


productividad de los trabajadores. Suponga adems que para este fin se recolectan datos
sobre las producciones semanales de 22 trabajadores de una fbrica en la semana anterior y
posterior a las vacaciones. Sean X y Y las producciones semanales antes y despus de las
vacaciones.
Como se trata de una prueba de una cola y la hiptesis alterna es la de que un periodo de
vacaciones aumentara la productividad de los trabajadores, se anticipa que la suma menor
tiene signo negativo.

Estadstica Inferencial Pgina 45


Jorge Luis Bustos Galindo
Trabajadores X Y Diferencias Rango Rango signado
YX Negativo Positivo
A 83 79 -4 12 -12
B 85 87 +2 4 +4
C 75 70 -5 15 -15
D 91 93 +2 4 +4
E 80 85 +5 15 +15
F 75 75 0 -
G 90 80 -10 19 -19
H 65 71 +6 17 +17
I 78 80 +2 4 +4
J 85 88 +3 8 +8
K 83 82 -1 1.5 -1.5
L 75 71 -4 12 -12
M 78 75 -3 8 -8
N 80 85 +5 15 +15
O 82 86 +4 12 +12
P 88 85 -3 8 -8
Q 85 82 -3 8 -8
R 80 87 +7 18 +18
S 78 78 0 -
T 81 84 +3 8 +8
U 70 85 +15 20 +20
V 80 81 +1 1.5 +1.5
T= -83.5 126.5

La menor suma es la negativa -83.5 y por consiguiente la estadstica de prueba es 83.5, al


omitir el signo. El valor T se refiere entonces a la tabla de T construida por Wilcoxon para
compararlo con el valor crtico para un valor de significancia dado. En la tabla I se da una
porcin de la tabla T. La tabla da los valores crticos de T a valores especificados de de
0.005, 0.01 y 0.025 para una cola y 0.01, 0.02 y 0.05 para dos colas. Para una cola con n = 20,
el valor crtico de T a = 0.01 es 43, el cual o debajo del cual se encuentra la regin crtica.
Como el valor observado es 83.5, no se rechaza la hiptesis nula o sea que un periodo de
vacaciones no obtiene efecto favorable de alguna significancia en la productividad de los
trabajadores.

Tabla I. Valores crticos de T para la prueba de rangos signados de Wilcoxon.


Nivel de significancia
Pares Prueba de una cola: 0.005 0.01 0.025
n Prueba de dos colas: 0.01 0.02 0.05
6 - - 0
7 - 0 2
8 0 2 4
9 2 3 6
10 3 5 8
11 5 7 11
12 7 10 14
13 10 13 17
14 13 16 21
15 16 20 25
16 20 24 30
17 23 28 35
18 28 33 40
19 32 38 46
20 38 43 52
21 43 49 59
22 49 56 66
23 55 62 73
24 61 69 81
25 68 77 89
Fuente: Adaptado de Frank Wilcoxon, Some Rapid Approximate Statistical Procedures
American Cyanamid Company, Nueva York, 1949, con autorizacin del autor y del editor.

Estadstica Inferencial Pgina 46


Jorge Luis Bustos Galindo
Observe que si se desea llevar a cabo una prueba de dos colas el valor crtico 43 viene
asociado a un nivel de significancia de 0.02 para n = 20.

En pares mayores de 25 la tabla de valores T ya no puede emplearse. Afortunadamente, para


n grande la distribucin de T es aproximadamente normal y lo usual es emplear el mtodo de
aproximacin normal. En efecto, T es aproximadamente N[ ( ) ] con n no inferior de 8.
Damos en seguida las frmulas para calcular la media y la desviacin estndar de la
distribucin T:
( ) ( )( )
( ) y
El valor Z se calcula como sigue:
( )

En el ejemplo anterior se tiene


( )
( )

( )( )

Que es mayor que el valor crtico -1.645 con . Por consiguiente, no se rechaza la
hiptesis nula de que el periodo de vacaciones no da por resultado aumento de la
productividad. Este resultado es el mismo obtenido por la prueba de signos estudiada antes.

Prueba de independencia
Entre todas las aplicaciones que se ofrecen de la distribucin Ji cuadrado, es tal vez la prueba
de independencia la que mayor empleo tiene. Este procedimiento consiste en probar la
hiptesis nula segn la cual dos criterios de clasificacin cuando se aplican a dos conjuntos de
entidades, son independientes. Por ejemplo, probar que el hbito de fumar es independiente
del sexo o probar que los retrasos en la llegada al trabajo de las personas que laboran en una
empresa es independiente del tiempo de vinculacin del trabajador.
La clasificacin de un conjunto de entidades, de acuerdo con dos criterios, puede presentarse
mediante una tabla en la que los renglones (filas) representan los diversos niveles de uno de
los criterios de clasificacin y las columnas representan los diversos niveles del segundo
criterio. Una tabla construida de esta forma se denomina, como una tabla de contingencia. La
interseccin de un rengln con una columna se denomina celda.
La hiptesis nula (H0) corresponde a la proposicin: Los dos criterios de clasificacin son
independientes. Si se llega rechazar H0, se concluir que los dos criterios de clasificacin no
son independientes en esta poblacin.
El procedimiento para realizar la prueba incluye los siguientes pasos bsicos:
1. Se especifica cada criterio con sus distintos niveles. Esto determinar los renglones y las
columnas.
2. Se registra en cada celda el nmero de individuos o entidades que satisfacen el nivel dado
por el rengln y la columna simultneamente.
3. Se calculan las frecuencias esperadas, las cuales se colocan en la parte inferior derecha de
la celda o al lado de la frecuencia observada, entre parntesis.
4. Se calcula la suma, valor de la estadstica de prueba,
( )

en donde,
= Nmero de entidades o individuos clasificados en las celdas .
= Frecuencia esperada para la celda .
k = Nmero de celdas.
5. Se busca en la tabla de Ji cuadrado el valor [ ( )( )] , r = nmero de renglones y c =
nmero de columnas.

Estadstica Inferencial Pgina 47


Jorge Luis Bustos Galindo
Si el valor , entonces se rechaza H0 al nivel de significancia .

Ejemplo 2. Suponga que se desea averiguar si existe alguna relacin entre el nivel de
formacin acadmica y el rendimiento laboral para un grupo de 200 empleados. El nivel de
formacin acadmica se clasifica en tres clases: escuela media o primaria, escuela superior y
escuela de especializacin, en tanto que el rendimiento en el trabajo se clasifican como
excelente, bueno o regular. La distribucin de frecuencia conjunta de las 200
observaciones est representada en la siguiente tabla.

Formacin acadmica
Rendimiento Media o primaria Superior Especializacin Total
Excelente 10 (15) 40 (30) 10 (15) 60
Bueno 30 (20) 30 (40) 20 (20) 80
Regular 10 (15) 30 (30) 20 (15) 60
Total 50 100 50 200

La frecuencia esperada (nmero que aparece entre el parntesis) se obtiene al multiplicar el


total de la columna por el total del respectivo rengln y dividir por el total de observaciones.
Ejemplo de las primeras frecuencias esperadas:
, , ,
A partir de la tabla anterior se obtiene como sigue:
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Este valor calculado se confronta con el valor de tabla Ji cuadrado ( ),


con tenemos,
[ ( )( )] [ ( )( )] [ ]
y con ,
[ ] .
El valor calculado es considerablemente superior a estos valores. As que aunque se fijara el
nivel de significancia al 1%, se podra rechazar la hiptesis nula de que no hay relacin
significativa entre la formacin acadmica de los empleados y su rendimiento en el trabajo.

Un caso especial en la prueba de independencia es aquel que emplea una tabla de


contingencia de 2x2. Si se utiliza tal tabla pude aplicarse una frmula simplificada para calcular
.
Suponga que las frecuencias observadas en una tabla de contingencia 2x2, sean a, b, c y d
como sigue:

Individuos o entidades A B Total


X a b a+b
Y c d c+d
Total a+c b+d n

El valor puede calcularse entonces por la frmula siguiente:

( )
( )( )( )( )
(1)
con (2 1)(2 1) =1 grado de libertad.

Con frecuencia se aplica la correlacin por continuidad de Yates, anloga a la correccin de


continuidad de la aproximacin normal a la binomial, para mejorar la aproximacin a la
probabilidad multinominal exacta. El valor corregido se calcula as:

(| | )
( )( )( )( )
(2)

Estadstica Inferencial Pgina 48


Jorge Luis Bustos Galindo
Ejemplo 3. En un estudio para determinar si exista relacin entre el sexo y el propsito de
elegir una carrera tcnica se entrevistaron 120 aspirantes a la universidad. Los resultados
fueron los siguientes:

Aspira a carrera tcnica


Sexo Si No Total
Hombre 40 30 70
Mujer 10 40 50
Total 50 70 120

Aplicando la frmula (1) tenemos,

( )

De la tabla III tenemos que para un grado de libertad el valor crtico que separa 0.1%
superior es 10.828. Por lo tanto, la hiptesis segn la cual existe independencia entre el sexo y
el propsito de elegir una carrera tcnica debe ser rechazada.

Si se tiene en cuenta la correccin por continuidad de Yates (2) obtenemos:

(| | )

que es ligeramente menor que el valor antes obtenido, pero aun as la hiptesis de
independencia debe ser rechazada.

Estadstica Inferencial Pgina 49


Jorge Luis Bustos Galindo
GUA DE CLASE N 7

1. Se desea determinar la eficacia de cierta dieta para adelgazamiento. Se sometieron a la


dieta 17 personas y se les tomaron sus pesos antes y despus de la dieta. Los resultados
se dan a continuacin:

Personas A B C D E F G H I J K L M N O P Q
Pesos antes 210 197 203 175 234 178 252 230 190 195 154 179 243 195 198 169 217
Pesos despus 208 196 195 175 229 170 242 221 213 180 150 173 235 204 193 169 210

Aplique la prueba T de Wilcoxon para determinar si la dieta ha reducido significativamente


los pesos de las personas del experimento a un nivel del 1%.

2. Los datos que siguen se reunieron con el propsito de determinar si las edades de los
esposos se pueden considerar superiores a las de las esposas.

Esposos 58 46 30 35 53 20 45 35 38 43 25 22 37 61 78
Esposas 47 35 25 38 49 21 42 40 38 38 26 24 39 60 68

Qu puede decir, de acuerdo con estos datos? Empleando la prueba T de Wilcoxon.


Emplee el nivel de significancia .

3. Se desea determinar si un alza en los salarios incrementara la produccin por hora de los
trabajadores. Sea X esta produccin por hora antes de alza de salarios y sea Y la misma
produccin despus del alza. Una muestra de 20 trabajadores arroja los siguientes datos:

Trabajadores A B C D E F G H I J K L M N O P Q R S T
X 91 83 70 64 85 86 91 66 72 60 75 84 71 80 70 85 65 75 75 65
Y 88 87 67 69 83 81 94 67 76 55 74 86 72 90 75 83 75 82 65 67

Utilice la estadstica de prueba T para probar la hiptesis nula de que el alza de salarios no
tiene efecto sobre la produccin horaria de los trabajadores, con la hiptesis alterna de que:
a. La produccin por hora tras el alza es superior a la de antes del alza a un nivel de
significancia del .
b. La produccin por hora tras el alza difiere de la produccin anterior al alza a un nivel de
significancia del .

4. Suponga que la siguiente es una muestra aleatoria de 1 000 electores clasificados por
afiliacin a partidos y preferencias de voto sobre determinada cuestin:

Preferencia Izquierdista Derechista


Pro 400 150
Contra 250 200

Pruebe la hiptesis segn la cual la afiliacin al partido no tiene nada que ver con la
preferencia del voto. Tome .

5. Cierta compaa desea determinar si el ausentismo se relaciona con la edad. Se toma una
muestra de 200 empleados al azar y se clasifican segn edad y causa de ausentismo as:
Edad
Causa
Menos de 30 30 50 Ms de 50
Enfermedad 40 28 52
Otras 20 36 24
Se encuentra la edad relacionada con el ausentismo? Tome .

Estadstica Inferencial Pgina 50


Jorge Luis Bustos Galindo
6. Una fbrica de automviles quieren averiguar si el sexo de sus posibles clientes no tienen
relacin con la preferencia del modelo. Se toma una muestra aleatoria de 2 000 posibles
clientes y se clasifican as:

Modelo
Sexo
I II III
Varn 350 270 380
Mujer 340 400 260

Pruebe la hiptesis segn la cual el sexo no tiene relacin con la preferencia del modelo.
Tome .

7. La administracin de cierta firma elabor una encuesta para determinar si el tipo de empleo
se relaciona con preferencias por una pliza de seguros. Una muestra de 300 empleados a
los que se entrevist arroj los datos siguientes:

Pliza de seguro
Tipo de empleados
I II III
Inspectores 18 6 12
Empleados de oficina 42 24 30
Obreros 36 72 60

Pruebe la hiptesis segn la cual el tiempo de empleo es independiente de la preferencia


por la pliza de seguros. Tome .

Estadstica Inferencial Pgina 51


Jorge Luis Bustos Galindo
Tabla I. Distribucin normal estndar
( )

Estadstica Inferencial Pgina 52


Jorge Luis Bustos Galindo
TABLA II. DISTRIBUCION TSTUDENT

c t1, r
La tabla da reas 1 y valores , donde, P[T c] 1 , y donde T tiene
distribucin t-Student con r grados de libertad.

r 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995


1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707


7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106


12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921


17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831


22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779


27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704


60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

Estadstica Inferencial Pgina 53


Jorge Luis Bustos Galindo
TABLA III. DISTRIBUCION

Grados libertad 0,1 0,05 0,025 0,01 0,005


1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
.
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59

10 15,99 18,31 20,48 23,21 25,19


11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
.
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
.
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
.
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
.
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95

70 85,53 90,53 95,02 100,43 104,21


80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17

Estadstica Inferencial Pgina 54


Jorge Luis Bustos Galindo
TABLA VI. DISTRIBUCION F

0.10 superior
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 39.8634 49.5000 53.5932 55.8329 57.24 58.2044 58.9059 59.4389 59.8575 60.1949 60.7052 61.2203 61.7402 62.002 62.2649 62.529 62.7942 63.0606 63.3281

2 8.52632 9.00000 9.16179 9.24342 9.29263 9.32553 9.34908 9.36677 9.38054 9.39157 9.40813 9.42471 9.44131 9.44962 9.45793 9.46624 9.47456 9.48289 9.49122

3 5.53832 5.46238 5.39077 5.34264 5.30916 5.28473 5.26619 5.25167 5.24 5.23041 5.21562 5.20031 5.18448 5.17636 5.16811 5.15972 5.15119 5.14251 5.1337

4 4.54477 4.32456 4.19086 4.10725 4.05058 4.00975 3.97897 3.95494 3.93567 3.91988 3.89553 3.87036 3.84434 3.83099 3.81742 3.80361 3.78957 3.77527 3.76073

5 4.06042 3.77972 3.61948 3.5202 3.45298 3.40451 3.3679 3.33928 3.31628 3.2974 3.26824 3.23801 3.20665 3.19052 3.17408 3.15732 3.14023 3.12279 3.105

6 3.77595 3.4633 3.28876 3.18076 3.10751 3.05455 3.01446 2.98304 2.95774 2.93693 2.90472 2.87122 2.83634 2.81834 2.79996 2.78117 2.76195 2.74229 2.72216

7 3.58943 3.25744 3.07407 2.96053 2.88334 2.82739 2.78493 2.75158 2.72468 2.70251 2.66811 2.63223 2.59473 2.57533 2.55546 2.5351 2.51422 2.49279 2.47079

8 3.45792 3.11312 2.9238 2.80643 2.72645 2.66833 2.62413 2.58935 2.56124 2.53804 2.50196 2.46422 2.42464 2.4041 2.38302 2.36136 2.3391 2.31618 2.29257

9 3.3603 3.00645 2.81286 2.69268 2.61061 2.55086 2.50531 2.46941 2.44034 2.41632 2.37888 2.33962 2.29832 2.27683 2.25472 2.23196 2.20849 2.18427 2.15923

10 3.28502 2.92447 2.72767 2.60534 2.52164 2.46058 2.41397 2.37715 2.34731 2.3226 2.28405 2.24351 2.20074 2.17843 2.15543 2.13169 2.10716 2.08176 2.05542

11 3.2252 2.85951 2.66023 2.53619 2.45118 2.38907 2.34157 2.304 2.2735 2.24823 2.20873 2.16709 2.12305 2.10001 2.07621 2.05161 2.02612 1.99965 1.97211

12 3.17655 2.8068 2.60552 2.4801 2.39402 2.33102 2.28278 2.24457 2.21352 2.18776 2.14744 2.10485 2.05968 2.03599 2.01149 1.9861 1.95973 1.93228 1.90361

13 3.13621 2.76317 2.56027 2.43371 2.34672 2.28298 2.2341 2.19535 2.16382 2.13763 2.09659 2.05316 2.00698 1.98272 1.95757 1.93147 1.90429 1.87591 1.8462

14 3.10221 2.72647 2.52222 2.39469 2.30694 2.24256 2.19313 2.1539 2.12195 2.0954 2.05371 2.00953 1.96245 1.93766 1.91193 1.88516 1.85723 1.828 1.79728

15 3.07319 2.69517 2.48979 2.36143 2.27302 2.20808 2.15818 2.11853 2.08621 2.05932 2.01707 1.97222 1.92431 1.89904 1.87277 1.84539 1.81676 1.78672 1.75505

16 3.04811 2.66817 2.46181 2.33274 2.24376 2.17833 2.128 2.08798 2.05533 2.02815 1.98539 1.93992 1.89127 1.86556 1.83879 1.81084 1.78156 1.75075 1.71817

17 3.02623 2.64464 2.43743 2.30775 2.21825 2.15239 2.10169 2.06134 2.02839 2.00094 1.95772 1.91169 1.86236 1.83624 1.80901 1.78053 1.75063 1.71909 1.68564

18 3.00698 2.62395 2.41601 2.28577 2.19583 2.12958 2.07854 2.03789 2.00467 1.97698 1.93334 1.88681 1.83685 1.81035 1.78269 1.75371 1.72322 1.69099 1.65671

19 2.9899 2.60561 2.39702 2.2663 2.17596 2.10936 2.05802 2.0171 1.98364 1.95573 1.9117 1.86471 1.81416 1.78731 1.75924 1.72979 1.69876 1.66587 1.63077

20 2.97465 2.58925 2.38009 2.24893 2.15823 2.09132 2.0397 1.99853 1.96485 1.93674 1.89236 1.84494 1.79384 1.76667 1.73822 1.70833 1.67678 1.64326 1.60738

Estadstica Inferencial Pgina 55


Jorge Luis Bustos Galindo
21 2.96096 2.57457 2.36489 2.23334 2.14231 2.07512 2.02325 1.98186 1.94797 1.91967 1.87497 1.82715 1.77555 1.74807 1.71927 1.68896 1.65691 1.62278 1.58615

22 2.94858 2.56131 2.35117 2.21927 2.12794 2.0605 2.0084 1.9668 1.93273 1.90425 1.85925 1.81106 1.75899 1.73122 1.70208 1.67138 1.63885 1.60415 1.56678

23 2.93736 2.54929 2.33873 2.20651 2.11491 2.04723 1.99492 1.95312 1.91888 1.89025 1.84497 1.79643 1.74392 1.71588 1.68643 1.65535 1.62237 1.58711 1.54903

24 2.92712 2.53833 2.32739 2.19488 2.10303 2.03513 1.98263 1.94066 1.90625 1.87748 1.83194 1.78308 1.73015 1.70185 1.6721 1.64067 1.60726 1.57146 1.5327

25 2.91774 2.52831 2.31702 2.18424 2.09216 2.02406 1.97138 1.92925 1.89469 1.86578 1.82 1.77083 1.71752 1.68898 1.65895 1.62718 1.59335 1.55703 1.5176

26 2.90913 2.5191 2.30749 2.17447 2.08218 2.01389 1.96104 1.91876 1.88407 1.85503 1.80902 1.75957 1.70589 1.67712 1.64682 1.61472 1.5805 1.54368 1.5036

27 2.90119 2.51061 2.29871 2.16546 2.07298 2.00452 1.95151 1.90909 1.87427 1.84511 1.79889 1.74917 1.69514 1.66616 1.6356 1.6032 1.56859 1.53129 1.49057

28 2.89385 2.50276 2.2906 2.15714 2.06447 1.99585 1.9427 1.90014 1.8652 1.83593 1.78951 1.73954 1.68519 1.656 1.62519 1.5925 1.55753 1.51976 1.47841

29 2.88703 2.49548 2.28307 2.14941 2.05658 1.98781 1.93452 1.89184 1.85679 1.82741 1.78081 1.7306 1.67593 1.64655 1.61551 1.58253 1.54721 1.50899 1.46704

30 2.88069 2.48872 2.27607 2.14223 2.04925 1.98033 1.92692 1.88412 1.84896 1.81949 1.7727 1.72227 1.66731 1.63774 1.60648 1.57323 1.53757 1.49891 1.45636

40 2.83535 2.44037 2.22609 2.09095 1.99682 1.92688 1.87252 1.82886 1.7929 1.76269 1.71456 1.66241 1.60515 1.57411 1.54108 1.50562 1.46716 1.42476 1.37691

60 2.79107 2.39325 2.17741 2.04099 1.94571 1.87472 1.81939 1.77483 1.73802 1.70701 1.65743 1.60337 1.54349 1.51072 1.47554 1.43734 1.3952 1.34757 1.29146

120 2.74781 2.34734 2.12999 1.9923 1.89587 1.82381 1.76748 1.72196 1.68425 1.65238 1.6012 1.545 1.48207 1.44723 1.40938 1.3676 1.32034 1.26457 1.19256

2.70554 2.30259 2.0838 1.94486 1.84727 1.77411 1.71672 1.6702 1.63152 1.59872 1.54578 1.48714 1.4206 1.38318 1.34187 1.29513 1.23995 1.1686 1

Estadstica Inferencial Pgina 56


Jorge Luis Bustos Galindo
TABLA VI. DISTRIBUCION F (Continuacin)

0.05 superior
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
df2=1 161.447 199.5 215.707 224.583 230.161 233.986 236.768 238.882 240.543 241.881 243.906 245.949 248.013 249.051 250.095 251.143 252.195 253.252 254.314

2 18.5128 19 19.1643 19.2468 19.2964 19.3295 19.3532 19.371 19.3848 19.3959 19.4125 19.4291 19.4458 19.4541 19.4624 19.4707 19.4791 19.4874 19.4957

3 10.128 9.5521 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944 8.572 8.5494 8.5264

4 7.7086 6.9443 6.5914 6.3882 6.2561 6.1631 6.0942 6.041 5.9988 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459 5.717 5.6877 5.6581 5.6281

5 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985 4.365

6 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.099 4.06 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6689

7 5.5914 4.7374 4.3468 4.1203 3.9715 3.866 3.787 3.7257 3.6767 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298

8 5.3177 4.459 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276

9 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7067

10 4.9646 4.1028 3.7083 3.478 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782 2.913 2.845 2.774 2.7372 2.6996 2.6609 2.6211 2.5801 2.5379

11 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.948 2.8962 2.8536 2.7876 2.7186 2.6464 2.609 2.5705 2.5309 2.4901 2.448 2.4045

12 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 2.341 2.2962

13 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.671 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064

14 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022 2.5342 2.463 2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1307

15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0658

16 4.494 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096

17 4.4513 3.5915 3.1968 2.9647 2.81 2.6987 2.6143 2.548 2.4943 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.104 2.0584 2.0107 1.9604

18 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168

19 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779 2.308 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302 1.878

20 4.3512 3.4928 3.0984 2.8661 2.7109 2.599 2.514 2.4471 2.3928 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432

Estadstica Inferencial Pgina 57


Jorge Luis Bustos Galindo
21 4.3248 3.4668 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205 2.366 2.321 2.2504 2.1757 2.096 2.054 2.0102 1.9645 1.9165 1.8657 1.8117

22 4.3009 3.4434 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 1.938 1.8894 1.838 1.7831

23 4.2793 3.4221 3.028 2.7955 2.64 2.5277 2.4422 2.3748 2.3201 2.2747 2.2036 2.1282 2.0476 2.005 1.9605 1.9139 1.8648 1.8128 1.757

24 4.2597 3.4028 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547 2.1834 2.1077 2.0267 1.9838 1.939 1.892 1.8424 1.7896 1.733

25 4.2417 3.3852 2.9912 2.7587 2.603 2.4904 2.4047 2.3371 2.2821 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.711

26 4.2252 3.369 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197 2.1479 2.0716 1.9898 1.9464 1.901 1.8533 1.8027 1.7488 1.6906

27 4.21 3.3541 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6717

28 4.196 3.3404 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 2.236 2.19 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541

29 4.183 3.3277 2.934 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6376

30 4.1709 3.3158 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223

40 4.0847 3.2317 2.8387 2.606 2.4495 2.3359 2.249 2.1802 2.124 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089

60 4.0012 3.1504 2.7581 2.5252 2.3683 2.2541 2.1665 2.097 2.0401 1.9926 1.9174 1.8364 1.748 1.7001 1.6491 1.5943 1.5343 1.4673 1.3893

120 3.9201 3.0718 2.6802 2.4472 2.2899 2.175 2.0868 2.0164 1.9588 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 1.429 1.3519 1.2539

3.8415 2.9957 2.6049 2.3719 2.2141 2.0986 2.0096 1.9384 1.8799 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591 1.394 1.318 1.2214 1

Estadstica Inferencial Pgina 58


Jorge Luis Bustos Galindo
TABLA VI. DISTRIBUCION F (Continuacin)

0.025 superior
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 647.789 799.5 864.163 899.583 921.847 937.111 948.216 956.656 963.284 968.627 976.707 984.866 993.102 997.249 1001.41 1005.59 1009.8 1014.02 1018.258

2 38.5063 39 39.1655 39.2484 39.2982 39.3315 39.3552 39.373 39.3869 39.398 39.4146 39.4313 39.4479 39.4562 39.465 39.473 39.481 39.49 39.498

3 17.4434 16.0441 15.4392 15.101 14.8848 14.7347 14.6244 14.5399 14.4731 14.4189 14.3366 14.2527 14.1674 14.1241 14.081 14.037 13.992 13.947 13.902

4 12.2179 10.6491 9.9792 9.6045 9.3645 9.1973 9.0741 8.9796 8.9047 8.8439 8.7512 8.6565 8.5599 8.5109 8.461 8.411 8.36 8.309 8.257

5 10.007 8.4336 7.7636 7.3879 7.1464 6.9777 6.8531 6.7572 6.6811 6.6192 6.5245 6.4277 6.3286 6.278 6.227 6.175 6.123 6.069 6.015

6 8.8131 7.2599 6.5988 6.2272 5.9876 5.8198 5.6955 5.5996 5.5234 5.4613 5.3662 5.2687 5.1684 5.1172 5.065 5.012 4.959 4.904 4.849

7 8.0727 6.5415 5.8898 5.5226 5.2852 5.1186 4.9949 4.8993 4.8232 4.7611 4.6658 4.5678 4.4667 4.415 4.362 4.309 4.254 4.199 4.142

8 7.5709 6.0595 5.416 5.0526 4.8173 4.6517 4.5286 4.4333 4.3572 4.2951 4.1997 4.1012 3.9995 3.9472 3.894 3.84 3.784 3.728 3.67

9 7.2093 5.7147 5.0781 4.7181 4.4844 4.3197 4.197 4.102 4.026 3.9639 3.8682 3.7694 3.6669 3.6142 3.56 3.505 3.449 3.392 3.333

10 6.9367 5.4564 4.8256 4.4683 4.2361 4.0721 3.9498 3.8549 3.779 3.7168 3.6209 3.5217 3.4185 3.3654 3.311 3.255 3.198 3.14 3.08

11 6.7241 5.2559 4.63 4.2751 4.044 3.8807 3.7586 3.6638 3.5879 3.5257 3.4296 3.3299 3.2261 3.1725 3.118 3.061 3.004 2.944 2.883

12 6.5538 5.0959 4.4742 4.1212 3.8911 3.7283 3.6065 3.5118 3.4358 3.3736 3.2773 3.1772 3.0728 3.0187 2.963 2.906 2.848 2.787 2.725

13 6.4143 4.9653 4.3472 3.9959 3.7667 3.6043 3.4827 3.388 3.312 3.2497 3.1532 3.0527 2.9477 2.8932 2.837 2.78 2.72 2.659 2.595

14 6.2979 4.8567 4.2417 3.8919 3.6634 3.5014 3.3799 3.2853 3.2093 3.1469 3.0502 2.9493 2.8437 2.7888 2.732 2.674 2.614 2.552 2.487

15 6.1995 4.765 4.1528 3.8043 3.5764 3.4147 3.2934 3.1987 3.1227 3.0602 2.9633 2.8621 2.7559 2.7006 2.644 2.585 2.524 2.461 2.395

16 6.1151 4.6867 4.0768 3.7294 3.5021 3.3406 3.2194 3.1248 3.0488 2.9862 2.889 2.7875 2.6808 2.6252 2.568 2.509 2.447 2.383 2.316

17 6.042 4.6189 4.0112 3.6648 3.4379 3.2767 3.1556 3.061 2.9849 2.9222 2.8249 2.723 2.6158 2.5598 2.502 2.442 2.38 2.315 2.247

18 5.9781 4.5597 3.9539 3.6083 3.382 3.2209 3.0999 3.0053 2.9291 2.8664 2.7689 2.6667 2.559 2.5027 2.445 2.384 2.321 2.256 2.187

19 5.9216 4.5075 3.9034 3.5587 3.3327 3.1718 3.0509 2.9563 2.8801 2.8172 2.7196 2.6171 2.5089 2.4523 2.394 2.333 2.27 2.203 2.133

20 5.8715 4.4613 3.8587 3.5147 3.2891 3.1283 3.0074 2.9128 2.8365 2.7737 2.6758 2.5731 2.4645 2.4076 2.349 2.287 2.223 2.156 2.085

Estadstica Inferencial Pgina 59


Jorge Luis Bustos Galindo
21 5.8266 4.4199 3.8188 3.4754 3.2501 3.0895 2.9686 2.874 2.7977 2.7348 2.6368 2.5338 2.4247 2.3675 2.308 2.246 2.182 2.114 2.042

22 5.7863 4.3828 3.7829 3.4401 3.2151 3.0546 2.9338 2.8392 2.7628 2.6998 2.6017 2.4984 2.389 2.3315 2.272 2.21 2.145 2.076 2.003

23 5.7498 4.3492 3.7505 3.4083 3.1835 3.0232 2.9023 2.8077 2.7313 2.6682 2.5699 2.4665 2.3567 2.2989 2.239 2.176 2.111 2.041 1.968

24 5.7166 4.3187 3.7211 3.3794 3.1548 2.9946 2.8738 2.7791 2.7027 2.6396 2.5411 2.4374 2.3273 2.2693 2.209 2.146 2.08 2.01 1.935

25 5.6864 4.2909 3.6943 3.353 3.1287 2.9685 2.8478 2.7531 2.6766 2.6135 2.5149 2.411 2.3005 2.2422 2.182 2.118 2.052 1.981 1.906

26 5.6586 4.2655 3.6697 3.3289 3.1048 2.9447 2.824 2.7293 2.6528 2.5896 2.4908 2.3867 2.2759 2.2174 2.157 2.093 2.026 1.954 1.878

27 5.6331 4.2421 3.6472 3.3067 3.0828 2.9228 2.8021 2.7074 2.6309 2.5676 2.4688 2.3644 2.2533 2.1946 2.133 2.069 2.002 1.93 1.853

28 5.6096 4.2205 3.6264 3.2863 3.0626 2.9027 2.782 2.6872 2.6106 2.5473 2.4484 2.3438 2.2324 2.1735 2.112 2.048 1.98 1.907 1.829

29 5.5878 4.2006 3.6072 3.2674 3.0438 2.884 2.7633 2.6686 2.5919 2.5286 2.4295 2.3248 2.2131 2.154 2.092 2.028 1.959 1.886 1.807

30 5.5675 4.1821 3.5894 3.2499 3.0265 2.8667 2.746 2.6513 2.5746 2.5112 2.412 2.3072 2.1952 2.1359 2.074 2.009 1.94 1.866 1.787

40 5.4239 4.051 3.4633 3.1261 2.9037 2.7444 2.6238 2.5289 2.4519 2.3882 2.2882 2.1819 2.0677 2.0069 1.943 1.875 1.803 1.724 1.637

60 5.2856 3.9253 3.3425 3.0077 2.7863 2.6274 2.5068 2.4117 2.3344 2.2702 2.1692 2.0613 1.9445 1.8817 1.815 1.744 1.667 1.581 1.482

120 5.1523 3.8046 3.2269 2.8943 2.674 2.5154 2.3948 2.2994 2.2217 2.157 2.0548 1.945 1.8249 1.7597 1.69 1.614 1.53 1.433 1.31

5.0239 3.6889 3.1161 2.7858 2.5665 2.4082 2.2875 2.1918 2.1136 2.0483 1.9447 1.8326 1.7085 1.6402 1.566 1.484 1.388 1.268 1

Estadstica Inferencial Pgina 60


Jorge Luis Bustos Galindo
TABLA VI. DISTRIBUCION F (Continuacin)

0.01 superior
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 4052.18 4999.5 5403.35 5624.58 5763.65 5858.98 5928.35 5981.07 6022.47 6055.84 6106.32 6157.28 6208.73 6234.63 6260.64 6286.78 6313.03 6339.39 6365.86

2 98.503 99 99.166 99.249 99.299 99.333 99.356 99.374 99.388 99.399 99.416 99.433 99.449 99.458 99.466 99.474 99.482 99.491 99.499

3 34.116 30.817 29.457 28.71 28.237 27.911 27.672 27.489 27.345 27.229 27.052 26.872 26.69 26.598 26.505 26.411 26.316 26.221 26.125

4 21.198 18 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.374 14.198 14.02 13.929 13.838 13.745 13.652 13.558 13.463

5 16.258 13.274 12.06 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.888 9.722 9.553 9.466 9.379 9.291 9.202 9.112 9.02

6 13.745 10.925 9.78 9.148 8.746 8.466 8.26 8.102 7.976 7.874 7.718 7.559 7.396 7.313 7.229 7.143 7.057 6.969 6.88

7 12.246 9.547 8.451 7.847 7.46 7.191 6.993 6.84 6.719 6.62 6.469 6.314 6.155 6.074 5.992 5.908 5.824 5.737 5.65

8 11.259 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814 5.667 5.515 5.359 5.279 5.198 5.116 5.032 4.946 4.859

9 10.561 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257 5.111 4.962 4.808 4.729 4.649 4.567 4.483 4.398 4.311

10 10.044 7.559 6.552 5.994 5.636 5.386 5.2 5.057 4.942 4.849 4.706 4.558 4.405 4.327 4.247 4.165 4.082 3.996 3.909

11 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.397 4.251 4.099 4.021 3.941 3.86 3.776 3.69 3.602

12 9.33 6.927 5.953 5.412 5.064 4.821 4.64 4.499 4.388 4.296 4.155 4.01 3.858 3.78 3.701 3.619 3.535 3.449 3.361

13 9.074 6.701 5.739 5.205 4.862 4.62 4.441 4.302 4.191 4.1 3.96 3.815 3.665 3.587 3.507 3.425 3.341 3.255 3.165

14 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.14 4.03 3.939 3.8 3.656 3.505 3.427 3.348 3.266 3.181 3.094 3.004

15 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805 3.666 3.522 3.372 3.294 3.214 3.132 3.047 2.959 2.868

16 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.89 3.78 3.691 3.553 3.409 3.259 3.181 3.101 3.018 2.933 2.845 2.753

17 8.4 6.112 5.185 4.669 4.336 4.102 3.927 3.791 3.682 3.593 3.455 3.312 3.162 3.084 3.003 2.92 2.835 2.746 2.653

18 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508 3.371 3.227 3.077 2.999 2.919 2.835 2.749 2.66 2.566

19 8.185 5.926 5.01 4.5 4.171 3.939 3.765 3.631 3.523 3.434 3.297 3.153 3.003 2.925 2.844 2.761 2.674 2.584 2.489

20 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368 3.231 3.088 2.938 2.859 2.778 2.695 2.608 2.517 2.421

Estadstica Inferencial Pgina 61


Jorge Luis Bustos Galindo
21 8.017 5.78 4.874 4.369 4.042 3.812 3.64 3.506 3.398 3.31 3.173 3.03 2.88 2.801 2.72 2.636 2.548 2.457 2.36

22 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258 3.121 2.978 2.827 2.749 2.667 2.583 2.495 2.403 2.305

23 7.881 5.664 4.765 4.264 3.939 3.71 3.539 3.406 3.299 3.211 3.074 2.931 2.781 2.702 2.62 2.535 2.447 2.354 2.256

24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 3.032 2.889 2.738 2.659 2.577 2.492 2.403 2.31 2.211

25 7.77 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129 2.993 2.85 2.699 2.62 2.538 2.453 2.364 2.27 2.169

26 7.721 5.526 4.637 4.14 3.818 3.591 3.421 3.288 3.182 3.094 2.958 2.815 2.664 2.585 2.503 2.417 2.327 2.233 2.131

27 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062 2.926 2.783 2.632 2.552 2.47 2.384 2.294 2.198 2.097

28 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.12 3.032 2.896 2.753 2.602 2.522 2.44 2.354 2.263 2.167 2.064

29 7.598 5.42 4.538 4.045 3.725 3.499 3.33 3.198 3.092 3.005 2.868 2.726 2.574 2.495 2.412 2.325 2.234 2.138 2.034

30 7.562 5.39 4.51 4.018 3.699 3.473 3.304 3.173 3.067 2.979 2.843 2.7 2.549 2.469 2.386 2.299 2.208 2.111 2.006

40 7.314 5.179 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801 2.665 2.522 2.369 2.288 2.203 2.114 2.019 1.917 1.805

60 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.718 2.632 2.496 2.352 2.198 2.115 2.028 1.936 1.836 1.726 1.601

120 6.851 4.787 3.949 3.48 3.174 2.956 2.792 2.663 2.559 2.472 2.336 2.192 2.035 1.95 1.86 1.763 1.656 1.533 1.381

6.635 4.605 3.782 3.319 3.017 2.802 2.639 2.511 2.407 2.321 2.185 2.039 1.878 1.791 1.696 1.592 1.473 1.325 1

Estadstica Inferencial Pgina 62


Jorge Luis Bustos Galindo
FUENTES DE INFORMACION

TEXTO BSICO

Estadstica para las ciencias Administrativas, Lincoln, L. Chao. Editorial MC GRAWH HILL.
Tercera edicin.

FUENTES DE INTERNET
http://es.wikipedia.org/wiki/Probabilidad

http://www.slideshare.net/milit/muestreo-aleatorio-simple

http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica

http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesis

Estadstica Inferencial Pgina 63


Jorge Luis Bustos Galindo

También podría gustarte