Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proba
Proba
by Rueda, Jos A.
Recomendacin:
Dirjase a los cuadros que concentran las frmulas y a las figuras
Dirjase despus a las tres fbulas
Valla finalmente al tema de su inters le parecer simple y puede aplicarlo
sistemticamente sin mayor conocimiento previo
Favor de no compartir el documento electrnico completo con estudiantes ni
colegas, es un material original y escrito letra a letra por un servidor,
evitemos plagios.
An Introduction
by Rueda, Jos A.
by Rueda, Jos A.
Conceptos base
Quien se enfrenta por primera vez a la Estadstica, es bombardeado con una pila de nmeros
que regularmente no tienen conexin con nada hasta antes conocido en su entorno; acto
seguido se le gua hacia el anlisis de esa lista de datos. El tiempo consumido en el anlisis no
permite al estudiante abundar sobre el objetivo o las implicaciones de su ejecucin. Por tanto,
el aprendiz puede confundirse fcilmente respecto al alcance, delimitacin y objeto de la
Estadstica como ciencia. En el campo de la investigacin, la toma de datos es una necesidad
comn y recurrente. Los datos se acumulan en grandes cantidades, y en efecto, despus de
tomarlos deben ser analizados con tal de obtener, a partir de estos, informacin sustancial con
aplicacin prctica.
La Estadstica es en principio una serie de tcnicas que aplicadas al conocimiento emprico, lo
convierten en conocimiento cientfico. Dicho de otra forma, es un conjunto de herramientas
para el anlisis de datos generados en la experimentacin y su conocimiento y aplicacin se
limitan a dos grandes reas. La primera de ellas es la estimacin de parmetros
poblacionales (i.e.: , 2) a partir de estimadores muestrales (equivalentemente: , s 2), ya sea
de forma puntual (=
ni=1 x i
] = [1-
]), donde el lado derecho es la precisin) para los parmetros que representan tales los
estimadores. El segundo campo de accin de la Estadstica son las pruebas de hiptesis
sobre los parmetros; es decir, se evala la posibilidad de que estos parmetros puedan ser
superiores o inferiores a un valor de referencia; o bien, se comparan dos o ms estimaciones
en muestras similares (1 Vs 2, etc.) respecto a su igualdad o diferencia. Las pruebas de
hiptesis y los intervalos de confianza siempre se refieren a los parmetros poblacionales,
pese a que se usen los estimadores en el proceso.
Al calcular valores como una media aritmtica () o la varianza musetral (s 2), ello implica que
se ha (i) tomado una muestra de individuos de alguna poblacin de inters, (ii) que en dicha
muestra se ha medido una variable que el investigador considera til y que al medir tal
variable un numero dado de veces (iii) se ha generado una lista de datos a partir de la cual
es posible calcular tanto la media y la varianza como otros estimadores. La media obtenida de
tales datos ( ) representa solo una estimacin de la media verdadera en la poblacin ( ) de
la que la muestra fue extrada (al igual que s 2 estima 2). A los valores poblacionales se les
conoce como parmetros y a los valores calculados en la muestra como estimadores.
La Estadstica es usada para medir la variacin y para tratar de manipularla o modificarla a
nuestro favor, por lo que el concepto de variable es de hecho el punto de partida. Una
variable aleatoria, se genera cuando en el inters por comprender o manipular un fenmeno,
se mide una caracterstica de forma repetitiva en varios individuos u objetos (unidades
experimentales). Si la variable es en efecto una medicin (g, m, L, s, kg/cm -2, C, etc.) esta
ser una variable cuantitativa y cada dato ser un valor en la recta real; frecuentemente la
by Rueda, Jos A.
by Rueda, Jos A.
Dnde est?
A lo largo de toda la recta real, al menos tericamente, todos los valores son igualmente
probables como mediciones de una variable aleatoria continua en particular; por ello cada vez
que se pretende describir una variable la pregunta natural inicial sera Dnde est?. Las
medidas de tendencia central conducen a un punto especfico de la recta real y dan una idea
precisa de la localizacin fsica de la variable en la recta, situacin por la que tambin son
llamadas medidas de localizacin. Cada uno de los datos puede dar una idea parcial de la
localizacin de la nube de datos, pero son las estimaciones de tendencia central (la media, la
mediana y la moda) las que nos dicen en concreto a que parte de la recta real ir para
encontrar nuestra variable para representar la nube de datos grficamente. Para el clculo
de medidas de tendencia central aplique las frmulas anotadas en el Cuadro 2.
La media es la medida ms precisa para localizar una variable aleatoria, significa el centro
geomtrico y aritmtico de una distribucin de datos y por tanto la distancia desde cualquier
dato hasta la media es en promedio menor respecto a la distancia entre los datos y cualquier
otro punto localizado sobre a recta real. La mediana es meramente la posicin central de los
datos cuando se ordenan ascendentemente, en este sentido no est ligada a la magnitud de
los datos. La moda solo es aquel valor que circunstancialmente se ha repetido en la toma de
datos un mayor nmero de veces. Si se tiene una distribucin simtrica de los datos
respecto a su media, las tres medidas de tendencia central coinciden, sealando al mismo
punto como la localizacin de la distribucin de la variable en la recta real.
Las medidas de tendencia central no dan ninguna informacin respecto a la dispersin, es
decir, sobre la distancia entre el centro de localizacin respecto a cada uno de los datos. Dada
la localizacin de una serie de datos, la variable no se encontrar totalmente definida sino
hasta que se especifique la cercana o lejana (dispersin) que los datos respecto a la posicin
definida como su localizacin (Fbula al final de este apartado).
Medidas de dispersin De qu tamao es?
Una vez ubicado el punto en que nuestra variable aleatoria se localiza en la recta real, ser
necesario, para completar la definicin de la misma: especificar el espacio fsico que ocupa.
Esta es una metfora, pero en la grfica de una funcin, es un hecho muy concreto. Adems
del espacio ocupado, debe especificarse su densidad; es decir, la frecuencia o concentracin
by Rueda, Jos A.
el cero
implica que los datos son idnticos. 2. Si a todos los valores de la variable se les suma una
constante la varianza no cambia. 3. Si todos los valores de la variable se multiplican por una
constante la varianza queda multiplicada por el cuadrado de dicho valor. 4. Si se tienen varias
distribuciones con la misma media y varianza conocida se puede calcular la varianza conjunta.
Observaciones: 1. La varianza, al igual que la media, es un ndice muy sensible a las datos
extremos; es decir, lejanos a la media. 2. En los casos que no se pueda hallar la media
tampoco ser posible hallar la varianza. 3 La varianza no est expresada en las mismas
unidades que los datos, ya que las desviaciones estn elevadas al cuadrado.
Propiedades de la desviacin estndar: 1. La desviacin estndar ser siempre un valor positivo
o cero, cero implicar que los datos son idnticos. 2. Si a cada dato se les suma la misma
constante, la desviacin estndar no se modifica. 3. Si todos los valores de la variable se
multiplican por una constante la desviacin estndar queda multiplicada por dicho valor. 4. Si
tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones
estndar se puede calcular la desviacin compartida o error estndar de su media compartida.
Observaciones: 1. La desviacin estndar, al igual que la media y la varianza, es un ndice muy
sensible a las puntuaciones extremas u outliers. 2. En los casos que no se pueda hallar la media
tampoco ser posible hallar la desviacin estndar, ya que esta es necesaria para su clculo. 3.
Entre ms pequea sea la desviacin estndar mayor ser la concentracin de datos alrededor
de la media y viceversa.
Datos agrupados Clasificando para visualizar rpidamente
by Rueda, Jos A.
Simblicamen
Cerrado
Abierto
Mixto
En la recta real
te
[5,10]
(5,10)
(5,10]
[5,10)
Interpretacin
De 5 hasta 10
De 5.00001 hasta 9.999
De 5.00001 hasta 10
De 5 hasta 9.999
anchura A idntica; cada una de estas k clases abarca todos los datos que sean estrictamente
mayores a su lmite inferior Li y menores o iguales a su lmite superior
(intervalo abierto
por la izquierda y cerrado por la derecha). Las tablas de frecuencia se construyen usando un
lmite inferior de la primera clase (L1), un ancho de clase (A) y un nmero de intervalos (k)
totalmente arbitrarios a conveniencia. La tabla de frecuencias contiene las siguientes columnas:
1. Los lmites de clase
& L
i.
que el promedio de los limites superior e inferior en cada clase. 3. La frecuencia absoluta fi de
datos que pertenecen a cada clase (conteo simple). 3.
5. La
frecuencia relativa acumulada Pi. Note que se usa una f para denotar la frecuencia absoluta y
una p
by Rueda, Jos A.
datos completos (duplicidad de anlisis). Esta situacin puede llevar a dos confusiones: 1. El
aprendiz usa un estimador calculado en los datos (e.g.
- L
= mn. (Rt-
entero permisible, en tanto se conserve la idea de Rt > R y todos los datos sean contenidos en
alguna clase.
El lmite superior de la primera clase o intervalo (
1)
se consigue al sumar la A al
lmite inferior de la misma (L 1); el lmite superior de la primera clase es igual al lmite superior
de la primera; y a partir de este punto se contina sumando A a los limites inferiores para
obtener los superiores en cada una de las k clases, as como igualando el lmite superior de una
clase con el inferior de la siguiente de manera montona y sucesiva. La frecuencia absoluta fi
es un conteo simple de los datos originales que pertenezcan a cada intervalo y la frecuencia
relativa
pi
by Rueda, Jos A.
Cuadro 2. Frmulas para el clculo de las principales medidas descriptivas con informacin
completa y en tablas de frecuencia.
Datos Originales
Media ()
Medidas
de
Mediana (
e )
e =
n
i=1
Tablas de Frecuencia
ki=1 f i v i
t= k
i=1 f i
xi
e =
Valor central o
tendencia
central
Moda (o)
ms veces
Le +
i)
A (0 .5 P
pi
o :
vi
de la clase con
fi
mayor
Varianza (
Medidas
de
Dispersi
n
S2 )
v i f i
k
i=1
2
S t =
S= S2
S t = S 2t
Desviacin
estndar(
S )
Coeficiente de
variacin (C.V.)
ni=1( x i)2
S=
n1
2
C.V.= (
)*100
C.V.
St
)*100
Rango (R)
R = mx. mn.
Rt =
k-
xi: cada uno de los valores de X. n: nmero de datos. fi: frecuencia absoluta de la clase i. vi: valor central de la clase i. Le :
Lmite inferior de la clase de la mediana. A: amplitud o ancho de clase, constante en todas las clases.
pi
: frecuencia
by Rueda, Jos A.
lmite inferior de la clase 1. La flecha atrs significa que se tomar la clase anterior a la de la mediana.
Re p r e s e n t a c i n g r fi c a
A partir de la tabla de frecuencias, se facilita la construccin de grficos simples que nos ayuden
a analizar visualmente la localizacin y la dispersin de los datos. Algunos de los grficos ms
usados son
a) Histograma. Se construye colocando en el eje de las abscisas a los lmites de clase Li y
para cada clase i, a partir de los que se erigen barras verticales de anchura A y con altura igual
a la frecuencia absoluta fi o relativa pi en cada intervalo.
b) Polgono de frecuencias. Segmentos de recta que unen los puntos de interseccin entre los
valores centrales de clase en el eje de las abscisas y las frecuencias absolutas o relativas en
el eje de las ordenadas (vi, fi vi, pi).
c) Ojiva o Polgono de frecuencias acumuladas. Resulta de unir mediante segmentos de recta los
puntos de interseccin entre los lmites superiores de clase, en el eje de las abscisas, con las
frecuencias absolutas o relativas, en el eje de las ordenadas (
, Fi
, Pi).
d) Diagrama de tallo y hojas: Consiste en anotar el intervalo como ttulo a margen izquierdo y
hacia la derecha en orden ascendente enumerar todos y cada uno de los valores que
pertenezcan a este. Si se dibujase una lnea curveada a la derecha de los ltimos valores
conectando todas las filas (intervalos), tendramos simulada una funcin de densidad cuyo eje
ser el margen izquierdo, donde se anotan los lmites de cada intervalo; o bien un polgono de
frecuencias girado a la derecha.
Ejemplo 1.1.
A partir de la serie de datos que se le presenta, que corresponden al peso
seco de 36 muestras (de dos tallos c/u ) de Pennisetum purpureum,
gramnea utilizada en la produccin de papel cuya principal fraccin til es el
tallo (datos tomados por el autor de este libro):
a)
b)
c)
d)
10
by Rueda, Jos A.
Agregue al menos dos columnas ms a la tabla de
f i vi
&
v i 2 f i
Datos:
250.6
403.3
284.2
141.6
254.1
141.7
251.5
224.4
235.5
285.6
439.5
239.9
299.7
284.4
212.1
194.5
153.3
342.2
237.5
258.8
243.8
298.7
448.1
260.7
300.1
178.5
322.5
278.1
329.6
328.9
248.1
267.1
219.1
241.1
414.4
341.6
vi
fi
Fi
pi
Pi
f i vi
v i f i
[]
Medidas de asociacin
Hasta ahora hemos lidiado con medidas que son de inters al describir una variable aleatoria;
ms en la prctica es muy frecuente que adems de estudiar alguna variable aislada, analicemos
a la par la forma en que esta es afectada por una segunda variable aleatoria. Para medir la
asociacin entre dos variables aleatorias, las medidas descriptivas de cada una de ellas por
separado no nos son de mucha utilidad. En los siguientes prrafos definiremos las principales
medidas de asociacin entre dos variables aleatorias, cuyos valores y cuyos estimadores (sus
medias y varianzas) pueden estar entrelazados en relaciones de tipo causa a efecto.
1.
11
by Rueda, Jos A.
3.
0.92=0.81. Solo los valores altos de correlacin no sufren un castigo sustancial con esta
transformacin. El coeficiente de determinacin no da informacin sobre si la relacin
directa o inversamente proporcional entre las variables asociadas.
4.
Regresin lineal. [1] (-,+) El coeficiente de regresin que asocia una variable
efecto con su variable causa, es una asociacin precisa, proporcional y confiable que nos
da incluso la posibilidad de predecir un valor de la variable efecto a partir de cualquier
valor propuesto de la variable causa. El coeficiente como tal (
b1
del nmero de unidades en que aumenta o disminuye una en funcin al cambio en una
unidad de la otra; de esta forma podemos anotar la relacin de manera grfica. La
ecuacin de regresin me dice adems el punto en el que el eje ordenado es cortado por
la recta de regresin, es decir 0.Para conocer un valor de la variable respuesta, dado un
valor de la variable explicativa se aplica la recta de regresin estimada
^y =b 0+ b1 X i
Puede consultarse la forma de clculo para las medidas de asociacin en el Cuadro 2. Note
como las cuatro medidas de asociacin son tienen estrecha relacin, observe la Figura 1.
Coeficiente de Correlacin
xy =
b1=
S xy
Sx S y
SPxy S xy
=
SPxx S2x
b0 = y b 1
3. Coeficiente de
Determinacin
R2xy =( xy )2
^y =b 0+ b1 xi
12
by Rueda, Jos A.
Relacin
Directamente
proporcional
(0,) positiva
Inversamente
proporcional
(-,0) negativa
Ninguna relacin
(0,1) positiva
(-1,0) negativa
(0,1)
(0,1)
(0,) positivo
(-,0) negativo
S xy
xy
R
2
xy
Pr o b a b i l i d a d
Conceptos
Los nmeros son ya una abstraccin, son un auxiliar en la representacin de la realidad que nos
rodea, nos ayudan a asirnos a hacernos del conocimiento; son una abstraccin ya que no existen
en la naturaleza, son una idea y un acuerdo entre los seres humanos. En un intento por describir
situaciones y hechos relativos a la incertidumbre diaria, tenemos a la Estadstica como una
poderosa herramienta constructora de conocimiento y a la Probabilidad como una pareja
perfecta para aceptar que nuestras conclusiones ms precisas de hecho no son tal cosa. La
experimentacin acerca al entendimiento y transforma la incertidumbre en hechos concretos;
13
by Rueda, Jos A.
convierte la abstraccin y el azar en verdades confiables; asla los errores a un rincn conocido y
manejable.
El hecho de que un suceso sea posible no nos da mucha informacin, pero un valor de
probabilidad nos da una medida inteligible de la certeza que tenemos de que dicho suceso en
efecto ocurra. La probabilidad de que se d un evento es igual a la suma de las probabilidades
de que ocurra cualquier elemento dentro de ese evento cuando pertenecen al mismo espacio
muestral (mismo experimento simple); por ejemplo, la probabilidad de obtener un non al lanzar
un dado es la suma de las probabilidades separadas para 1, 2 y 3 (P[X=non] = P[X=1] + P[X=2]
+ P[X=3]).
La Estadstica y la Probabilidad son dos ciencias estrechamente ligadas. A la estimacin y a las
pruebas de hiptesis, dada su naturaleza de lidiar con la variacin, siempre se les asigna una
probabilidad. Al analizar los conceptos bsicos de esta relacin se prepara al estudiante para la
interpretacin de un intervalo de confianza y para la estimacin de los errores en una prueba de
hiptesis, algunas definiciones se presentan a continuacin
Un experimento aleatorio es aquel cuyos resultados no pueden predecirse antes de llevarlo a
cabo. Si un investigador pudiera predecir con total certeza los resultados de un experimento,
este no lo llevara a la prctica, por lo que la incertidumbre y la variacin estn ligadas a la
experimentacin; tales condiciones son manejadas mediante Probabilidad.
Un espacio muestral
14
by Rueda, Jos A.
Conviene retomar algunos conceptos bsicos sobre tcnicas de conteo y algo de teora de
conjuntos antes a fin de aterrizar de manera ms precisa en los axiomas elementales de la
probabilidad.
Teora de conjuntos
Un conjunto es una coleccin de elementos, objetos o individuos que comparten una
caracterstica en comn. El nombre de un conjunto es una letra mayscula; sus elementos se
enumeran dentro de llaves despus de un signo de igualdad que precede al nombre del
conjunto. Para enumerar los elementos de un conjunto pueden escribirse uno a uno todos ellos o
mencionar la caracterstica que comparten, cualquiera de estas dos formas es correcta. No
obstante,
A={2,4,6,8}
M={x/x es un nmero primo menor que 20}, expresin equivalente a: M={2,3,5,7,11,13,
17,19}
A B
15
by Rueda, Jos A.
P I
I-P =
EUP =
P S
Ic =
16
by Rueda, Jos A.
A B
A B
A-B
Conjunto A
Conjunto B
Operacin
Ac
indicada
Figura 2: Diagramas de Venn Euler para las operaciones bsicas entre conjuntos
Particin de S: Dado un conjunto universal S y una serie de conjuntos A 1, A2, An, tales que:
todo conjunto
Ai S
nji=1 A i A j=0
U ni=1 A i=S
) y que la
17
by Rueda, Jos A.
ocasiones el nmero total de posibilidades que se pueden dar no es una obviedad; para ello se
aplicar una de las tres tcnicas descritas a continuacin.
1.
Aplicando
En una
P r=
3.
n!
( nr ) !
Combinaciones [nCr]: El nmero de combinaciones es el nmero de formas diferentes
en que pueden ser tomados r objetos de un total de n (el concepto es idntico hasta
aqu al de permutaciones), sin importar el orden de estos r elementos. As por ejemplo,
una combinacin abc ser para fines prcticos exactamente igual a la combinacin bca
o acb.
n!
Cr= n =
r r ! ( nr ) !
()
Ejemplo:
(i)
ii)
iii)
iv)
v)
18
by Rueda, Jos A.
Probabilidad
Dado un evento A que agrupa uno o ms elementos en S para un experimento con n resultados
igualmente posibles; la probabilidad de A, P(A), ser el cociente cuyo dividendo est definido
por el nmero de elementos favorables a A, na, y cuyo divisor es el nmero total de elementos
en S, n.
P ( A )=
na
n
Ejemplo:
i)
Entonces:
P (W ) =
nw 5
=
n 7
0.7143
P ( F )=
nf 2
= =0.2857
n 7
Juan saca una ficha al azar de su juego de domin. Los elementos de espacio
muestral son: S= {(0,0), (0,1), (5,6), (6,6)} & n=28. Si definimos los eventos
M: {Mula};
iii)
PP: {ficha con (par, par)} & F: {Ficha (6,*)}. Obtenga las
Axiomas de la probabilidad
1. Dado un evento A, la probabilidad de que ocurra tal evento ser un valor tal que:
0 P(A) 1
i=1 n A i
Teoremas de la probabilidad
19
by Rueda, Jos A.
Pr o b a b i l i d a d c o n d i c i o n a l
Dados dos eventos A y B en S, tal que P(A)>0, la probabilidad de B dada la ocurrencia de A, P(B|
A), se definir por:
P ( B| A )=
P ( A B)
P( A)
Note que la ocurrencia de A modifica la P(B), ya que P(B|A) P(B)
Eventos independientes:
Dados dos eventos A y B en S, se dice que A y B son eventos independientes si y solo si P(A|
B)= P(A), P(B|A)= P(B) & P(AB)=P(A)P(B); es decir, la ocurrencia de uno no modifica la
probabilidad de ocurrencia del otro. Por lo tanto dos eventos dependientes Ay B en S; sern
aquellos cuya probabilidad de interseccin sea tal que P(AB)>0, P(A|B) P(A) &P(B|A) P(B); es
decir, la ocurrencia de uno si modifica la probabilidad de ocurrencia del otro.
En ocasiones la dependencia est asociada al muestreo sin reemplazo. Al existir dependencia,
las probabilidades son condicionales.
Eventos mutuamente excluyentes:
Dados dos eventos A y B en S, se dice que A y B son mutuamente excluyentes si y solo si P(A|
B)= 0, P(B|A)=0 y P(AB)=0. Dos eventos mutuamente excluyentes no pueden ocurrir
simultneamente y adems la ocurrencia de uno imposibilita la ocurrencia del otro.
P ( A|B )=
P ( A B)
P( B)
P ( B| A )=
P ( A B)
P( A)
20
by Rueda, Jos A.
P ( B ) P ( A|B )=P( A B)
P ( A ) P ( B|A )=P( A B)
P ( B ) P ( A|B )=P ( A ) P ( B| A )
P (B)=
P ( A ) P ( B| A )
P ( A|B )
P ( A|B )=
P ( A )=
P ( A ) P ( B| A )
P (B)
P ( B ) P ( A|B )
P ( B| A )
P ( B| A )=
P ( B ) P ( A|B )
P ( A)
Ejemplo:
Se supone que los graduados son todlogos Entre 200 empleados de una empresa 150 del
total resultaron ser graduados y 60 del total resultaron ser todlogos.
pertenecen a ambas categoras son 40. Elabore con estos datos una tabla de doble entrada y
auxilindose de diagramas de Venn-Euler calcule la probabilidad que se le pide:
i) Defina los eventos graduado, no graduado, todlogo y no todlogo usando la inicial de la
palabra y el smbolo para complemento de un conjunto. i.e.: G= {graduado} & G c = {NO
graduado}.
ii) Cul es la probabilidad de que un empleado sea graduado o todlogo (Unin)
iii) Cul es la probabilidad de que NO sea todlogo y si sea graduado (Interseccin)
iv) Cul es la probabilidad de que sea todlogo dado que es graduado, usando como referencia la
probabilidad de la interseccin.
v) Cul es la probabilidad de que sea todlogo dado que es graduado, usando como referencia la
probabilidad condicional inversa (Condicional)
vi) Cul es la P(GcUTc) y la P (GUT)c?
Solucin:
T
TC
Marginal G
40
110
150
GC
20
30
40
Marginal T
60
140
200
21
by Rueda, Jos A.
Los eventos no son independientes, dado que la probabilidad de ocurrencia de uno de ellos
depende de la previa o no ocurrencia del otro.
i)
ii)
GT
P
iii)
TC G
P
iv)
P (T |G )=
v)
P (T |G )=
vi)
G T
P
P (T G)
P (G)
P(GT ) P(T )
P(G)
),
P ( GC T C ) y P(G T )C
i)
ii)
G
G
P (G
iii)
) = P(G)+ P(T) - P (G
) =
150 60
40 170
+
=
200 200 200 200
= 0.85
22
by Rueda, Jos A.
Es obvio que P (TC
TC
TC
= 0.55
TC
30/200 110/200 40/200
G
T
P
P (T |G )=
iv)
G
T
0.667
40 60
(
)
P ( G|T ) P(T ) 60 200
P (T |G )=
=
150
P(G)
200
v)
2400
60
150
40
150
=0.267 ; Obtngase
P(G|T)
GC T C
P
vi)
GC T C
P
) =
) = P(
30
200
GC
= 0.15
)+ P(
TC
)-P(
40 140 30 150
+
=
200 200 200 200
P(G T )C
GC T C
= 1 0.85 = 0.15
= 0.75
Ejercisios:
i)
Se seleccionan dos semillas aleatoriamente, una por una, de una bolsa que contiene
diez semillas de flores rojas y cinco de flores blancas. Cul es la probabilidad de
que:?
ii)
a)
b)
23
by Rueda, Jos A.
a una mujer?
Suponga que se ha llevado un estudio sobre la efectividad de un nuevo producto que
combate el acn en los jvenes (llmese Asexia) y que tal producto se ha usado en
los pacientes por un ao, los resultados son:
Erradicacin
29
Asexia
Ningn cambio
69
Suma
98
A
Placebo
15
60
75
Suma
44
129
173
P
E
Teorema de Bayes:
Si A1, A2, A3, An forman una particin de S, y D es un evento en S; tal que P(D|A i)0;
entonces:
n
b)
P ( A i|D )=
P(DA i) P( Ai )
n
P( DA j ) P (A j )
P ( D|Ai ) P ( A i )
i=1
P( D Ai ) P( A i)
P( D)
j=1
Ejercisios:
i)
24
by Rueda, Jos A.
Modelos de probabilidad:
I . Fu n c i o n e s
25
by Rueda, Jos A.
f X (x)
1.
2.
(f X ( x ) )=1
0 f X ( x )
f X (x)
probabilidad de ocurrencia de un valor exactamente igual a x, entre todos los posibles valores de
X. Pese a que la definicin es homloga a la mencionada arriba; la f.d. es igual a cero (
f X ( x ) =0
1.
2.
f X ( x) dx
f X ( x ) =0
=1
26
by Rueda, Jos A.
b
f X ( x ) dx
3. P(a<x<b)=
F X ( x)
a x.
Esta definicin
puede equipararse con la frecuencia relativa acumulada Pi de una tabla de frecuencias. La F.D.
puede obtenerse a partir de la f.p. para el caso discreto, o a partir de la f.d. si la variable es
continua; en las variables cualitativas se obtiene mediante una suma de f.p., y en las variables
cuantitativas se integra la f.d. desde el lmite inferior de la variable hasta el valor de x en el que
se evala la funcin. Las definiciones simblicas de F.D., f.d. y f.p., as como sus relaciones, se
muestran en el Cuadro 3. Las propiedades elementales de la F.D. son:
x
F X ( x )= f X ( x)dx
1.
(variables continuas)
&
2.
FX ( x )
f X (x )
(variables discretas)
x +
FX ( b)
FX ( a)
>
Funcin de
probabilidad
f X (x)=P(X =x)
Variables
aleatorias
continuas
pi
f.p.
F X ( x )=P ( X x )= f X (x )
F.D
.
Funcin de densidad
f X (x)=P(X =x)
Pi
Funcin de distribucin
Funcin de distribucin
x
f.d.
F X ( x )=P ( X x )= f X ( x ) dx
F.D
.
27
by Rueda, Jos A.
Notacin:
Para delimitar bien una funcin de densidad, una funcin de probabilidades o una funcin de
distribucin; debe especificarse, adems de la funcin misma, los limites en recta real para los
cuales esta es vlida. La notacin ms convencional incluye: a) el smbolo
f X (x ) F X ( x )
(segn sea el caso) seguido de b) una llave de agrupacin que delimita dos casos: c) la frmula
de la funcin y los valores de X para los cuales la funcin es definida o verdadera & d) un cero
separado por una coma de la leyenda de otra forma que implica que los valores de X no
mencionados en el primer caso darn como resultado que la funcin sea nula o no vlida.
e.g.:
( nx) p q
x
nx
, x=0,1, n
f X ( x)=
0
FX ( x )
d .of .
cuales la funcin sea cero, b)aquellos para los que la funcin sea vlida y c) aquellos para los
cuales la funcin sea siempre igual a 1.
Representacin grfica de una funcin
Suponga que se tiene un f.p. & su F.D., representadas por los datos mostrados a continuacin;
entonces las grficas que representan a f.p. y a su F.D. son las presentadas en la Fig. 4a.
X
f X (x)
FX ( x )
4
3/24
5
2/24
6
8/24
7
5/24
8
4/24
9
2/24
3/24
5/24
13/24
18/24
22/24
24/24
f X (x)
= 2/X2 ; entonces
28
by Rueda, Jos A.
6600tn29a5660
6600tn29a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
X , f X ( x)
X , FX ( x )
6600tn2a5660
6600tn29a5660
6600tn1a5660
6600tn29a5660
6600tn29a5660
6600tn28a5660
6600tn28a5660
6600tn28a5660
6600tn1a5660
6600tn28a5660 6600tn3a5660
X ,
6600tn1a5660
6600tn28a5660 6600tn3a5660
[
X , FX ( x )
= 2/X ) ]
2
Note que en la grfica de la f.p. y su F.D. las probabilidades estn marcadas por puntos sobre
valores enteros; mientras que en el caso de f. d. y su respectiva F.D., la representacin curva
indica un nmero infinito de valores posibles en una escala continua.
Media y varianza con base en una distribucin terica
Si se conoce la funcin de probabilidades (variable discreta), o en su caso, la funcin de densidad
f X (x)
(variable continua)
mencionada funcin, aplicando las siguientes definiciones (a la derecha las frmulas para una
variable continua):
= x f X ( x)= x f X (x) dx
29
by Rueda, Jos A.
2= x2 f X (x ) 2 2= x 2 f X ( x ) dx 2
Si se conoce la
f X (x)
FX ( x )
, y/o la
a partir de estas es muy sencillo. De igual manera pueden aproximarse su media y varianza.
i)
Usemos el clsico ejemplo del dado para simplificar la explicacin. Si se lanza un dado al
aire tendremos:
f X ( 4 )=
P(X=4)= 0.1
f X (1 )+ f X ( 2 ) + f X ( 3 ) + f X ( 4 )
] = 0.6
= 1/6,
FX ( 4 )
= P(X4) =P(X<5) = [
= 4/6 .
x i f X ( x i )=
i=1
= x f X ( x)=
1 f X ( 1 ) +2 f X ( 2 ) +3 f X ( 3 ) +6 f X ( 6 )
=[
] =3.5
Y su varianza:
2
i =1
x 2 f X ( x)2= x i2 f X ( x i )
=[
1 f X ( 1 ) +2 f X ( 2 ) +3 f X ( 3 ) + 6 f X ( 6 )
]-
varianza, una buena estimacin?. Note que en la definicin de la varianza, los lmites de la
variable aleatoria X (-, +), se sustituyen por los lmites que corresponden al caso particular
(1, 6).
30
by Rueda, Jos A.
f X (x )=
2
X2
d.o.f.), entonces:
Verifiquemos que en efecto es una f.d.:
f X ( x ) dx=1 ?
1
2
dx=1 ?
X2
[ ]
2
=1?
X 1
1=1
2
dx
= x f X (x) dx= x ( 2 ) dx=2 ( )
x
x
1
1
= 2[ln x
2
2
= x f X ( x ) dx = x
1
21
= 2[ln 2- ln 1] = 1.386
( x2 ) dx(1.386)
2 dx
1
1.92 =0.08
La probabilidad de obtener un valor entre 1 & 1.5 entre 1.5 & 2 ser:
1 .5
P(1<x<1.5)=
f X ( x ) dx
1
1 .5
P(1.5<x<2)=
f X ( x ) dx
1 .5
2
dx
X2
[ ]
1. 5
[ ]
X22 dx
1 .5
2
X
2
X
1. 5
= -1.33+ 2 = 0.66
31
by Rueda, Jos A.
con tal de facilitar el entendimiento de los principales modelos existentes para describir
la distribucin de una variable aleatoria.
Modelos de probabilidad:
I I . D i s t r i b u c i o n e s D i s c r e t a s M o d e l o s d e Pr o b a b i l i d a d
Cualitativos
Cuando se trabaja con variables aleatorias cualitativas o discretas; las modelos con los que
tenemos que lidiar ms frecuentemente son: Distribucin Bernoulli, Distribucin Binomial,
Distribucin Poisson, Distribucin Hipergeomtrica y Distribucin Geomtrica.
Distribucin Bernoulli
En principio una variable cualitativa nace de un conteo de elementos que cumplen con una
condicin dada. Por ejemplo, superar una longitud de 2 m, ser verde, soportar un voltaje de 220,
tener ms de 100 pginas, saber nadar, aprobar el examen, etc. Todas estas condiciones son
preguntas de SI NO, variables dicotmicas cuyas nicas posibilidades son: que se cumpla la
condicin (xito), o que esta no se cumpla (fracaso).
Un evento Bernoulli asocia una probabilidad p al hecho de que se verifique la condicin buscada,
y una probabilidad q al evento de que la condicin no se cumpla. Aqu el espacio muestral tendr
slo dos elementos, S={Exito, Fracaso}, con P(Exito) =p, P(Fracaso)=q & p+q =1. La f.p. de la
1 x
p q
B (p) entonces:
, x=0,1
f X (x)=
0
d .of .
32
by Rueda, Jos A.
ii)
iii)
Distribucin Binomial
Dados n Eventos Bernoulli con P(Si)=p P(No)=q, la Distribucin binomial cuenta nmero de
xitos obtenidos, x, al buscar la condicin dada, y por ende cuenta indirectamente el nmero de
Si
(nx) p q
x
nx
X (n , p)
entonces:
, x=0,1, n
f X ( x)=
0
d .of .
33
by Rueda, Jos A.
f X (x)
& FX ( x )
5 x
, x=0,1, 5
f X (x)=
0
d .of .
b)
X
f X (x)
3x10-04
0.006
0.051
0.205
0.41
0.328
FX ( x )
3x10-04
0.006
0.058
0.263
0.672
x f X (x )
0.614
x 2 f X (x )
1.843
16.8
c)
x f X ( x)= x f X (x )=
x f X ( x ) = x f X ( x )
34
by Rueda, Jos A.
2=
alternativamente
f X ( 4 )+ f X ( 5 )= 0.41+0.328
f X ( 3)
f)
1P ( X 3 )=1F X (3)
=1-.263
f X (x )
=0.205
g)
f X (x)
, podemos
notar que entre 3 a 5 de las piezas tendrn en efecto la proteccin a veinte aos.
Esta conclusin se basa en que
f X (x)
X ( )
entonces:
e
, x=, 1,2
x!
f X ( x)=
35
Si
by Rueda, Jos A.
0,d.o f .
siendo
= 2.
Ejemplo:
i)
ii)
Distribucin Hipergeomtrica
Dadas n repeticiones de un Evento Bernoulli, cuya probabilidad de xito es p; la Distribucin
Hipergeomtrica cuenta el nmero de xitos obtenidos al seleccionar los elementos de forma
sucesiva y con muestreo sin reemplazo; de manera que a cada evento se modifican las
probabilidades. Si
X Hyp( N , A , n)
, entonces:
36
by Rueda, Jos A.
B
( Ax )( nx
) , n< An< B
( Nn )
f X ( x)=
x=0,1,2 n
0
d. o. f.
np
y la varianza es 2 = npq
N n
N1
, con p = A/N.
Ejemplo:
i)
En una sala de cmputo se ha notado que de los 55 estudiantes que usan las
maquinas, el 40% las usan de manera ldica. El supervisor de zona llegar el da de
hoy y decomisar las maquinas si ms de la mitad resultan ser usadas de manera
ldica en el momento; cuando el supervisor llega solo 10 estudiantes estn usando
los equipos.
a) Modele este caso mediante una Distribucin Hipergeomtrica y anote sus
parmetros.
b) Calcule la probabilidad de que las maquinas sean decomisadas
c) Calcule la probabilidad de que solo dos maquinas se estn usando para trabajar
ii)
Distribucin Geomtrica
Dados un nmero dado de repeticiones de un Evento Bernoulli, cuya probabilidad de xito es p;
la Distribucin geomtrica cuenta el nmero de veces que ha de repetirse el evento Bernoulli
37
by Rueda, Jos A.
para obtener un solo xito. La notacin y la f.p. que describen a las principales distribuciones
Si X G ( p )
entonces:
q x1 p , x=1,2
f X ( x)=
0
d. o. f.
q
p
y su 2 =
q
2
p
Ejemplo:
i)
Don John sali hoy a la busca de patos para cazar. Su puntera no es muy buena, y
las ltimas veces ha tenido que disparar a diez patos para cazar apenas uno.
a) Modele este caso mediante una Distribucin Geomtrica y anote sus parmetros,
su f.p. y su F.D.
b) Cul es la media y la varianza para este caso en particular?
c) A cuntos patos debe disparar John si pretende volver a casa con un pato?
X (n , p)
Si X P( )
n
x
()
n x
p q
e x
, x=, 1,2
x!
, x=0,1, n
f X (x)=
f X (x)=
0
0,d.o f .
d .of .
Distribucin Hipergeomtrica
Si
X Hyp( N , A , n)
Distribucin Geomtrica
Si X G( p)
q x1 p , x=1,2
38
by Rueda, Jos A.
f X (x)=
B
( Ax )( nx
) , n< An< B
( Nn )
d. o. f.
f X (x)=
x=0,1,2 n
0
d. o. f.
Modelos de probabilidad:
I I I . D i s t r i b u c i o n e s C o n t i n u a s M o d e l o s d e Pr o b a b i l i d a d
Cuantitativos
Las distribuciones continuas ms comunes en el ejercicio de la inferencia estadstica han sido
modeladas en funcin a las necesidades en el anlisis de datos, y frecuentemente no describen
el comportamiento de una variable aleatoria natural (mediciones directas en campo), sino a
parmetros o a estimadores de los parmetros, obtenidos a partir de mediciones en una
muestra. Por lo que a estas distribuciones se les denomina Distribuciones derivadas del
muestreo.
Existe un sin nmero de distribuciones tericamente vlidas como funciones de densidad, ya que
la definicin matemtica agrupa a toda densidad o rea bajo una curva o recta cuya integral
en todo su rango sea exactamente igual a 1.0 (vea Propiedad 1 de la f. d.); como es el caso de la
funcin:
f X (x )=
2
2
X
cualquier intervalo vlido han sido descritas al final del captulo de funciones, sirva ese caso
como un ejemplo anticipado. Antes de adentrarnos en las distribuciones derivadas del muestreo,
analizaremos un ejemplo ms sobre una distribucin continua clsica.
Distribucin Uniforme Continua
Cuando una variable aleatoria es equi-probable para cualquier par de intervalos (a 1, b1) & (a2, b2)
de anchura idntica; su fX(x) es una lnea de altura igual a f X(x) que parte de
. SI X
( 1 , 2
y termina en
39
by Rueda, Jos A.
1
, < x <2
21 1
f X ( x)=
0
d. o. f.
2
( 2 1)
12
integrar
F X ( x )=
1
1+ 2
2
; su varianza =
ba
21 ; & su F.D se obtiene
al
1
.
2 1
{2
1
e
2
1
(x ) }
,< x <
f X ( x)=
0
d. o. f.
40
by Rueda, Jos A.
A diferencia de los
modelos probabilsticos vistos hasta ahora, la funcin de densidad de la
distribucin normal no se usa para el clculo de probabilidades.
Convencionalmente la variable original se transforma a un modelo estndar
para el cual las probabilidades ya han sido calculadas y tabuladas.
Propiedades:
1. La distribucin normal es simtrica respecto a y la P(X>) = P(X<) =0.5.
2. Debido a la simetra, = e = o (la media, la moda y la mediana
coinciden).
3. La distancia horizontal entre el punto de inflexin (por cualquier lado) y es
.
, 2
X N ), entonces Z =
0 ,1
1 {
e
2
f Z( z)
z
2
} , < z <
,
d.o.f.
Por no representar Z una variable natural tomada del mundo real, se dice que
es una distribucin derivada del muestreo. La curva Z conserva todas las
propiedades que la distribucin normal tiene; adicionalmente, facilita el clculo
de probabilidades.
Otras distribuciones derivadas del muestreo
A este selecto y til grupo pertenecen: adems de la ya mencionada 1.
Distribucin Normal Estndar o Z, que describe el comportamiento de una
41
by Rueda, Jos A.
Distribucin normal
Distribucin normal
estndar
X N ( , 2 )
0,1
ZN )
Distribucin normal de
errores de una variable
aleatoria continua
Transformacin de X
cuando
X N
para
facilitar el clculo de
probabilidades
Distribucin F de Fisher
f F(f )=
2v ' s ;
til al hacer
estimaciones sobre la
razn de dos varianzas
Z 1 + Z1 + + Z v
Evaluar sumas de
valores Z elevados al
cuadrado (distribucin
de una varianza)
Distribucin t de
Student
t=
2
u
2
v
Distribucin ji-cuadrada
2v
v
Transformacin de la
curva normal estndar
para analizar datos
procedentes de
muestras pequeas
by Rueda, Jos A.
2v
by Rueda, Jos A.
[Ha] Correcta
[Ha] Incorrecta
La luna es de cualquier
material excepto queso
A lo mucho es medio da
Ya pasa de medio da
Es la una de la tarde
La media poblacional es a lo
mucho 16 (16)
La media poblacional es
mayor a 16 (>16)
La media es a lo menos 16 (
16)
La varianza es menor a 5
(2<5)
La proporcin de estudiantes
10.0 difiere de 0.1 (P>0.1
P<0.1)
La proporcin de estudiantes
con 10.0 es mayor a 0.1
(P>0.1)
La luna es de queso
La varianza de X es por lo
menos 5 (25)
La proporcin de estudiantes
con 10 es 0.1
(P=0.1)
Condicin
desconocid
a
Hiptesis
verdadera
Hiptesis falsa
Decisin tomada
Rechazar
No rechazar
(a) Error tipo I
( c ) Decisin correcta
( b ) Decisin correcta
by Rueda, Jos A.
by Rueda, Jos A.
de una
distribucin normal
Al realizar una prueba de hiptesis sobre la media de una distribucin normal,
se pueden dar tres casos de inters prctico: a) el investigador est interesado
en demostrar que la media poblacional ( ) es menor a cierta constante (
o ),
por lo que esta ser H a y la prueba ser de cola izquierda; b) el investigador desea
comprobar que la media poblacional () supera a un valor dado (
o ), dando lugar a
46
by Rueda, Jos A.
una prueba de cola derecha; c) el investigador desea probar que la media es igual al
valor de referencia, lo que significar una hiptesis que descarta la mitad de en cada
lado de la distribucin. A continuacin se detallan los tres casos en una prueba de
hiptesis de este tipo:
Cas
Cola
Hipte
Hiptesi
sis
nula
alterna
H0:
Ha: <
o
a)
Izquier
da
Regla de decisin
n<30 2estimada
Rechazar H0 si
-
b)
Derech
a
H0:
Ha: >
c)
Dos
colas
<
t , n1
Rechazar H0 si
>
t CAL
t CAL
Regla de
decisin
n>30 2conocida
Rechazar H0 si
Z CAL
Rechazar H0 si
Z CAL
t , n1
<
Z 1
>
H0:
Ha:
Rechazar H0 si
Rechazar H0 si
t CAL > t , n1
2
Z CAL
>
Z /2
t CAL=
n( x o)
S
Varianza conocida o
muestra grande (Z)
Z CAL=
n( x o )
by Rueda, Jos A.
(i)
= 980
Ha: Es
>980 ?
980
n( x o) 16(1000980)
=
=0.8
b)
t CAL=
c)
t , n1=t 0.05,15=1.7531
d) Rechazar H0 si
100
t CAL
>
t , n1
Rechazar H0 si
t CAL
Rechazar H0 si
0.8
>
>
t 0.05,15
1.7531
<1050 ?
Caso '
48
by Rueda, Jos A.
1 050
a) H0:
n( x o ) 16 (10001050)
=
=2.0
b)
Z CAL=
c)
Z =Z 0.05=1.65
d) Rechazar H0 si
100
Z CAL
<
Z
Rechazar H0 si
Z CAL
Rechazar H0 si
2.0
<
<
Z 0.05
1.65
( 1 2)
medias
Sea
12
^
=
&
x 1x 2
Cola
a)
Izquier
da
Hipte
Hiptes
Regla de decisin
Regla de
sis
is
decisin
nula
alterna
Varianzas homogneas
y estimadas (t)
Ho:
Ha: <
Rechazar H0 si
t CAL
<
Varianzas
heterogneas y
conocidas (Z)
Rechazar H0 si
49
by Rueda, Jos A.
Z CAL
t ,n +m2
b)
Derech
a
Ho:
Ha: >
Rechazar H0 si
t CAL
>
t , n+m 2
c)
Dos
colas
Ho:
Ha:
Rechazar H0 si
>
t
2
, n+m2
t CAL
12
=0
<
Rechazar H0 si
Z CAL
>
Z 1
Rechazar H0 si
Z CAL
>
Z /2
y la hiptesis es el caso c), ya
tres casos aqu planteados son equivalentes a los presentados para el caso de
las pruebas de hiptesis sobre una sola media (tema anterior) y que son
basados de hecho en t y Z tambin. Las nicas dos diferencias residen en que
el valor calculado refleja la diferencia entre dos medias y el valor de tablas se
consulta con n+m-2 grados de libertad. Cuando el valor de a usar no sea
especificado en el requerimiento de una prueba deber de usarse regular e
indistintamente un =0.05.
Varianzas
homogneas y
estimada (t)
Valor
calculad
o
t CAL=
Varianzas
heterogneas y
conocidas s (Z)
( x 1x 2 ) 0
2
p
1 1
+
n m
Z CAL=
( x 1x 2 )0
21 22
+
n m
by Rueda, Jos A.
rechazo de H0; los valores que estn fuera de esta zona comprenden la
zona de NO rechazo de H0.
Ejemplos:
(i)
(ii)
x
x
= 2035.2
S 21
= 3077.3
S2
Es 2 1?
^
0=0=
Caso
x 1x 2=
-1042.1
b)
t CAL=
S p=
( x 1x 2 ) 0
Sp
( 1n + m1 )
1042.1 0
=
92650
( 121 + 19 )
= -7.7641
= 92650
51
by Rueda, Jos A.
t
c)
, n+m2
=t 0.025, 19=2.0930
t CAL
d) Rechazar H0 s|
>
, n+m2
Rechazar H0
t CAL
s
>
t 0.025,19
x
x
= 2035.2
= 3077.3
S2
=80235.8 & m = 9,
Es
2 - 1 > 700
^
0=700=
Caso
x 2x 1=
1042.1
700
^
=
b)
t CAL=
x 2x 1
^ 0
S 2p
( 1n + m1 )
12
21
1042.1700
=
92650
( 121 + 19 )
= 2.5487
52
by Rueda, Jos A.
2
S 2p=
S1 ( n1 ) + S2 (m1)
n+m2
= 92650
x 2x 1=
1042.1;
indicndole
que
la prueba
( x 1x 2 )
de
^
=
por
hiptesis
t o t a l m e n t e d i f e re n t e s i s e p e g u n t a p o r l a d i f e re n c i a
se pregunta por a diferencia 2 - 1
es
2 - 1 que si
t , n+m 2 =t 0.05,19=1.7291
c)
d) Rechazar H0 s
t CAL
t , n+m 2
>
Rechazar H0 s
t CAL
>
t 0.05,19
Rechazar H0 s 2 .5487
1.7291
= 7940
= 8230
21
=15750 n = 5; respecto al
^
=
x 2x 1
^
=
x 1x 2
( =2-1
= 1-2,
by Rueda, Jos A.
I V. Pr u e b a s d e Hi p t e s i s s o b r e l a v a r i a n z a
distribucin normal
b)
Cola
Hiptesis
Hiptesis
nula
H0:
alterna
Izquierd
a
Derecha
2 20
H0:
2 20
c)
Dos
colas
Ha:
2 < 20
Ha:
2 > 20
Ho::
Ha: :
2= 20
2 20
Regla de decisin
Rechazar H0 s
Rechazar H0 s
2CAL <
2CAL >
2 ,n1
CAL <
Rechazar H0 s
21 ,n1
(1 2 ), n1
2CAL >
( 2 ) ,n1
2CAL=
( n1 ) S 2
20
Ejercicios:
Resuelva
(i)
El llenado de las bolsas de alimentos a granel presenta un reto
importante cuando el 9llenado y sellado de las bolsas se hace
mecnicamente; es posible encontrar desde 987 hasta 1019 g en las
54
by Rueda, Jos A.
(iii)
El proceso usado para pulir discos de silicio a fin de que su grosor sea
el apropiado es aceptable solo si su desviacin no supera 0.005 pulg.
En una muestra de 15 discos se ha calculado una desviacin de
0.0064. Con un a PETI mxima de 0.01, verifique si el proceso de
pulido es aceptable.
by Rueda, Jos A.
] o confianza
< L
), equidistantes
que se acepta que aun cuando tenemos un intervalo de valores en los que
posiblemente se localice el parmetro, de alguna manera estamos tambin
afirmando que el parmetro no estar contenido entre esos valores en el
100(1-)% de los casos.
^
^ E ) =1
P ( E<
< +
56
by Rueda, Jos A.
E=t /2,n1
de inters, es ; entonces la
( Sn )
E=Z / 2
( Sn )
=
entonces
E=t
2
, (n +m2)
Sp
1 1
+
n m
E=z
2
21 22
+
n m
; segn la
12 ,
, segn la naturaleza
de las variables implcitas. Para el primer caso de este prrafo, hablamos usamos
^
como semilla (
x E
al estimador
x
( 1 x 2 ) E .
, donde L =
^
E
L=
12
en
con base en
para nosotros
P (L
< L
+ E . Se pueden plantear
21
22
con base
S 21
S 22 ; segn sea necesario.
by Rueda, Jos A.
F) es el mismo (en el IC
II .
d e una
P x t
2
, n1
,n1
2
( ))
P x Z
< < x + Z
=1
n
2
2 n
( )
58
II I.
by Rueda, Jos A.
x
x
( 1 x 2)+t
2
( 1x 2 )t
2
1 1
(
1 1 n + m)
S ( n + m )< <
, ( n+m 2 )
, ( n+m2 )
2
p
S 2p
=1
P
59
by Rueda, Jos A.
x
x
( 2 x 1)+t
2
( 2 x 1 )t
2
1 1
(
1 1 n + m)
S ( n + m )< <
S 2p
, ( n+m 2 )
, ( n+m2 )
2
p
=1
P
Varianzas heterogneas
x
x
( 1x 2)+ z
2
21 22
+
n m
21 22
+
< 12 <
n m
2
=1
P
( 1x 2 )z
x
x
( 2x 1)+ Z
2
21 22
+
n m
21 22
+
< 2 1<
n m
2
=1
P
( 2 x 1 )Z
I V.
2 de
by Rueda, Jos A.
anloga de hacer predicciones sobre los lmites mximos y mnimos que puede
tomar la varianza poblacional, es establecer un intervalo de confianza para
para
con base en
S2
S 2 ( n1 ) 2 S 2 ( n1 )
< < 2
=1
2 /2, ( n1)
1 /2, (n1)
V.
varianza s
1
2
2
normal
A manera de introduccin se aclarar en primer instancia que las comparaciones
entre medias no siempre son correctas; para que una comparacin de medias sea
adecuada. Los lados izquierdo y derecho de la hiptesis de tal comparacin deben
tener varianza similar. A este prerrequisito se la prueba de hiptesis se le llama
homogeneidad de varianzas. La mencionada similitud no implica que sean
idnticas, sino que provengan de la misma poblacin.
61
by Rueda, Jos A.
2
21
22
2
2
1
1, o bien
21 , para la
22
primera expresin) como el total. Si la varianza dos es mayor 2
1
21
22
segundo toma a
como el 100%.
1 &
y el
(( )
S2
S 21 F n1
m1 ,
<
2 S 2 m1
<
F n1 , =1
21 S 21
2
S 21
21 S 21 n1
1
P 2 m1 < 2 < 2 F m1 , =1
S 2 F n1, 2 S 2
2
(( )
2
by Rueda, Jos A.
terminado e iba a recoger a McQueen para resguardarlo. Sin embargo Mac result ser el ganador
de acuerdo con el reglamento. El enorme cuerpo del triler haba sido lo nico que logro tomar
la foto ya que todos los competidores fueron obstruidos por el trailer. En efecto, para que la
carrera sea justa: todos los autos competidores deberan tener dimensiones similares.
120.
63
by Rueda, Jos A.
64