Está en la página 1de 202

MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

MODULO
DE
ESTADSTICA II

ALBERTO QUINTO JIMNEZ
Especialista en Matemtica Avanzada.
Universidad Nacional de Colombia.
FACULTAD DE HUMANIDADES
PROGRAMA DE ADMINISTRACIN DE EMPRESAS
UNIVERSIDAD TECNOLOGICA DEL CHOC
DIEGO LUIS CORDOBA
2007
1
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
OFRENDA
A mi querida ta, recordada por siempre ROSA QUINTO MOSQUERA
a mis hijos, a todos y cada uno de mis actuales y futuros alumnos.

2
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
INDICE
PAGINA
Ofrenda
Introduccin
UNIDAD 1.0
SUCESOS ALEATORIOS Y PROBABILIDAD. 5
1.1 Concepto de suceso 6
1.2 Fenmeno o Experimento Aleatorio 6
1.3 Espacio Muestral 6
1.4 Clasificacin de los Sucesos 7
1.5 Anlisis Combinatorio 10
1.5.1Factorial de N 10
1.5.2 Permutaciones 11
1.5.3 Variaciones Simples 12
1.5.4 Combinaciones 13
1.6 Teora Elemental de la Probabilidad 15
1.7 Teoremas del Clculo de Probabilidad 17
1.8 Axiomatizacin de la Probabilidad 20
Ejercicios
UNIDAD 2.0
DISTRIBUCIONES DE PROBABILIDADES. 31
2.1 Variables Aleatorias 32
2.2 Esperanza Matemtica 32
2.3 Distribuciones de Probabilidades 34
2.3.1 Poisson 34
2.3.2 Binomial 38
2.3.3. Normal 41
Ejercicios
3
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
UNIDAD 3.0
DECISION ESTADISTICA 54
3.0 Nociones sobre pruebas de hiptesis y mtodos no parametritos 55
3.1 Pruebas de Uno y Dos Extremos 57
3.2 Reglas de Decisin 57
3.3 Errores Estadsticos 58
3.4 Potencia de una Prueba 59
3.5 Procedimientos Estadsticos en la Investigacin 59
3.6 Diferencias entre las Pruebas Parmetricas y no Parmetricas 60
3.6.1 El tamao de la muestra 62
3.7 Prueba Binomial 63
3.8 Prueba de los Signos 68
3.9 Prueba de Cox y Stuart para Tendencia 76
3.10Prueba X
2
Para Diferencias en Probabilidades 2x2 78
3.11Prueba de Mc Nemar Para Cambios de Significancias 82
3.12Prueba de la Mediana 86
3.13Prueba de Bondad de Ajuste de Kolmogorov-Smirnov 91
3.14Prueba U de Mann-Whitney 95
3.15Prueba de Kruskal-Wallis 101
3.16Prueba de Sparman 106
UNIDAD 4.0
ASPECTOS GENERALES SOBRE SERIES CRONOLOGICAS, NUMEROS
INDICES Y TASAS. 112
4.0 Series cronolgicas. 113
4.1 Componentes de una serie. 113
4.2 Determinacin de la tendencia. 115
4.3 Ajuste rectilneo. 116
4.4 Los nmeros ndices. 123
4.5 usos de los nmeros ndices. 138
4.6 Proporciones, porcentajes, razones y tasas. 148
Ejercicios aplicativos - Bibliografa.
4
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
INTRODUCCIN
Cada da de nuestras vidas estamos expuestos a una amplia variedad de
informacin numrica relativa a fenmenos como la actividad del mercado de
valores, los hallazgos de estudios de mercados, los resultados de encuestas
de opinin, las tasas de desempleo, los pronsticos de xito futuro de
industrias especificas y datos en general.
Es importante recordar que el tema de la estadstica moderna abarca la
recoleccin presentacin y caracterizacin de informacin para ayudar tanto
en el anlisis de datos como en el proceso de la toma de decisiones.

Por la forma en que est estructurado el modulo, es poca la preparacin
matemtica que se requiere para entenderlo. Aquellos que hayan tomado el
primer curso de estadstica, no tendrn dificultad alguna para seguir la
manipulacin matemtica y estadstica en este curso. Tengo fe en que el
estudiante, o el lector comn, llegar a darse cuenta que en la estadstica
hay ms que las meras matemticas; que la Estadstica, primero que todo,
es una filosofa, una manera de pensar. Si el estudiante puede desarrollar los
conceptos, ver la estadstica simplemente como el vehculo para su
expresin y comunicacin de resultados.
Aspiro, en consecuencia, prestar un nuevo servicio a los educadores
Colombianos; porque considero que todo lo que se hace en beneficio de los
futuros ciudadanos ha de estar inspirado en un elevado anhelo de
engrandecimiento patrio, y ello slo se logra con la dedicacin y el sacrificio
constante de cada uno de nosotros, pues como lo expresa claramente
CHARLES SUMMER, la verdadera grandeza de las naciones est en
aquellas cualidades que constituyen la grandeza del individuo.

5
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
UNIDAD 1.0
SUCESOS ALEATORIOS Y PROBABILIDAD
OBJETIVO
DE LA UNIDAD: Desarrollar una comprensin de los conceptos bsicos de probabilidad
que son la base necesaria para el desarrollo y estudio de distribuciones de probabilidad e
inferencia estadstica.
CONTENIDOS:
1.1 Concepto de suceso
1.2 Fenmeno o Experimento Aleatorio
1.3 Espacio Muestral
1.4 Clasificacin de los Sucesos
1.5 Anlisis Combinatorio
1.5.1Factorial de N
1.5.2 Permutaciones
1.5.3 Variaciones Simples
1.5.4 Combinaciones
1.6 Teora Elemental de la Probabilidad
1.7 Teoremas del Clculo de Probabilidad
1.8 Axiomatizacin de la Probabilidad
Ejercicios
6
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.1 CONCEPTO DE SUCESO
Se denomina suceso o evento (E), a cada uno de los posibles resultados de
un experimento aleatorio.
1.2 FENMENOS O EXPERIMENTOS ALEATORIOS
Son todos aquellos sucesos cuyos resultados estn establecidos pero no se
pueden predecir con exactitud a priori, o sea que en las mismas
condiciones pueden presentar resultados diferentes.
Adems consideramos que el fenmeno aleatorio puede ocurrir
respectivamente en forma indefinida.
Los fenmenos aleatorios, se caracterizan por la imposibilidad de predecir
resultados individuales; sin embargo, al repetir el mismo experimento
aleatorio en condiciones idnticas los resultados promedios o globales
presentan una regularidad o estabilidad sorprendente.
As, hablamos de los fenmenos o experimentos aleatorios de lanzar una o
ms monedas, uno o ms dados, de extraer una o ms carta de una
baraja, de extraer uno o ms remedio de un lote, etc.
1.3 ESPACIO MUESTRAL
Consideremos el experimento aleatorio que consiste en lanzar un dado y
anotemos los posibles resultados (E):
E = 1, 2, 3, 4, 5, 6
Los resultados posibles del experimento constituyen un conjunto (S)
S = { 1, 2, 3, 4, 5,6 }
7
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Que llamaremos espacio de los resultados o espacio muestral
correspondiente al experimento aleatorio de lanzar un dado una sola
vez.
En general, si tomamos el conjunto fundamental de resultados posibles de
un fenmeno aleatorio, como un conjunto de puntos, tal que cada
punto represente uno y slo uno de los resultados posibles, el espacio
que rene estos puntos es espacio muestral.
. Cara.
.Cruz

Conjunto de los eventos que aparecen al lanzar una moneda al aire.
.1 .3 .6

.4 .2 .5
Conjunto de los eventos que aparecen al lanzar un dado al aire.
8
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.4 CLASIFICACIN DE LOS SUCESOS
1.4.1 SUCESO SEGURO:
Es aquel que siempre se produce al realizar un experimento aleatorio
(certeza).
EJEMPLO: En el experimento de lanzar un dado, el suceso de que salga un
nmero menor que 7 es un suceso seguro.
1.4.2 SUCESO IMPOSIBLE
Es aquel que nunca se produce al realizar un experimento aleatorio
(imposibilidad).
EJEMPLO: En el experimento de lanzar un dado, el evento de que salga un
nmero mayor que seis es un suceso imposible.
1.4.3 INCLUSIN DE SUCESO
Se dice que un suceso E
1
est incluido en otro E
2
cuando todos los sucesos
elementales de E
1
pertenecen al suceso E
2.
Se representa con el
smbolo E
1
E
2
significa: E
1
est contenido en E
2
.
9
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO: Si en el experimento de lanzar un dado al aire se consideran los
dos sucesos siguientes:
E
1:
que salga la cifra 4.
E
2
: que salga una cifra par.
Se observa que E
1
E
2.
1.4.4 IGUALDAD DE SUCESO
Dos sucesos son iguales cuando estn formado por los mismos sucesos
elementales.
EJEMPLO: En el experimento de una mujer dar luz un bebe se consideran dos
sucesos.
E
1
: que salga nio
E
2
: que no salga nia
Se observa fcilmente que E1 = E2, puesto que ambos sucesos aqu valen al
suceso elemental que salga nio
1.4.5 SUCESO CONTRARIO
Se denomina suceso contrario,
E
_
de un determinado suceso E, al suceso
formado por todos los sucesos elementales que no estn en E y que
pertenecen al conjunto de todos los sucesos elementales de un
experimento.
EJEMPLO: En el experimento de lanzar una moneda al aire, si se considera el
suceso E: que salga cruz, el suceso contrario
E
_
se forma por los
sucesos que no estn en E pero que pertenecen al experimento
E
_
:
que salga cara.
1.4.6 DOS SUCESOS (UNO U OTRO)
10
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Cuando se estn interesados por 2 sucesos A y B, se desea que se
produzca uno de los dos sucesos A B, es fcil comprender que esto
ocurre siempre que se produce algn suceso elemental de A o B, es
decir, perteneciente a la unin A B de los dos conjuntos.
EJEMPLO: Sean los sucesos A y B siguientes:
A : que salga 1 2 al lanzar un dado.
B : que salga 2, 5 6 al lanzar un dado.
Tendr lugar el suceso A B cuando se produzca uno cualquiera de los
sucesos elementales de A, de B de A U B.
B
A
1. 2. 5.
6.
1.4.7 DOS SUCESOS SIMULTNEOS (UNO Y OTRO)
Si se desea que se produzcan los dos sucesos A y B al mismo tiempo, basta
con que se produzca uno de los sucesos elementales de la
interseccin de los sucesos dados, ya que por ser de la interseccin A
B, pertenecen al mismo tiempo a ambos conjuntos de sucesos
elementales, con lo que los dos sucesos A y B se verificarn a la vez.
EJEMPLO: En el ejemplo anterior, el suceso A y B tendr lugar cuando se
verifique el suceso elemental que salga 2, ya que ste es el nico
suceso perteneciente a la interseccin de A y B.
En el caso de que la interseccin sea vaca A B = , se dice que los
sucesos de A y B son INCOMPATIBLES, ya que por ser disjuntos no
tienen ningn elemento en comn y no pueden darse al mismo
tiempo.
11
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.4.8 MAS DE DOS SUCESOS SEGUROS
Cuando se esta interesado por ms de dos sucesos, A, B, C disjuntos dos a
dos que cumplen con la condicin de que su reunin A U B U C
requiera certezas, S, puede afirmarse que siempre se verificar uno
de los sucesos A, B C del experimento aleatorio.
EJEMPLO: Sea el experimento de lanzar un dado al aire. Si se consideran los
sucesos siguientes:
A : que salga 1 2.
B : que salga 3 4
C : que salga 5 6
Se comprueba fcilmente que los 3 sucesos son disjuntos 2 a 2. Pues:
A n B =
A n B =
B n C =
Adems A U B U C es el suceso seguro.
1.5 ANLISIS COMBINATORIO
Las secciones que discutiremos a continuacin hacen referencia a las
diferentes maneras en que en un momento dado podemos ordenar,
agrupar o seleccionar los elementos de un conjunto.
Este mtodo combinatorio nos llevar al clculo de la probabilidad a - priori
de un suceso en forma ms sencilla y gil.
EJEMPLO: Si hay 3 candidatos para Gobernador y 5 para alcalde, los dos
cargos pueden ocuparse de 3 x 5 = 15 formas.
1.5.1 FACTORIAL DE N.
El factorial de n se denota por n! y viene definido por
n! = n (n-1) (n - 2). . .1
As: 5! = 5.4.3.2.1 = 120
12
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
4! 3! = (4.3.2.1) (3.2.1) = 144
Conviene decir que O! = 1
1.6 PERMUTACIONES
Una permutacin de n objetos diferentes tomados de r en r es una
ordenacin de r objetos entre los n dados y atendiendo a la situacin
de cada objeto en la ordenacin. El nmero de permutaciones de n
objetos tomados de r en r se representa por
n
P
r
, P
n,r
P(n,r)

y
viene dado por
n
P
r
= n (n -1 ) ( n -2) ... ( n - r + 1) =
n
n r
!
( )!

En particular, el nmero de permutaciones de n objeto tomados de n en n es
n
P
n
= n ( n -1 ) ( n -2 ) ... 1 = n!
EJEMPLO 1: El nmero de permutaciones de las letras a, b, c tomadas de dos
es:
3
P
2
= 3.2 = 6, estas son ab, ba, ac, bc, cb.
EJEMPLO 2: El nmero de permutaciones de las palabras estadstica es:
11
1 2 2 2 2 1 1
1110 98 7 654 321
12121212111
39916800
16
2494800
!
!. !. !. !. !. !. !
. . . . . . . . . .
. . . . . . . . . .

Puesto que hay: 1e, 2s, 2t, 2a, 2i, 1d, 1c
EJEMPLO 3: En un departamento sanitario municipal se tienen cinco oficinas
adyacentes que van a ser ocupadas por cinco enfermeras A, B, C, D y
E. De cuntas maneras diferentes pueden asignarse las enfermeras a
las oficinas.

5
P
5
=
5
5 5
54 321
0
120
1
120
!
( )!
. . . .
!

13
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.6.4 PERMUTACIN CON REPETICIN
Se llaman permutaciones con repeticin de n elementos, donde hay r
1
iguales y de la misma clase, r
2
iguales y de la misma clase etc. donde
r
1
+ r
2
+.....= n a las distintas ordenaciones que se le puedan dar al
conjunto.
Se puede expresar as:
P(n,r
1
,r
2
,...) =
n
r r
!
! !...
1 2
EJEMPLO: Cuntos nmeros distintos, de cinco cifras, se pueden formar con
el nmero 22111.
SOLUCIN: Hay dos iguales y tres iguales, luego:
p (5, 2, 3) =
5
2!3
12 34 5
12 12 3
10
!
!
. . . .
( . )( . . )

Se pueden formar 10 nmeros distintos con el nmero dado.
1.7 VARIACIONES SIMPLES
En algunas circunstancias nos interesa ordenar o conocer la disposicin de
objetos cuando no se toman todos los elementos del conjunto a la
vez.
EJEMPLO: Cuantos nmeros de dos cifras se pueden formar con los dgitos
del 1 al 5.
Evidentemente se trata de formar ordenaciones, de cinco elementos tomados
de a dos y escribimos:
V
5.2
=
5
5 2
!
( )!
V
5.2
=
5
3
5 4 20
!
!
x


14
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO: De cuntas maneras se pueden elegir y disponer en un estante 3
libros tomados de un conjunto de 10.
V
10.3
=
10
10 3
10
7!
109 8 7!
7!
720
!
( )!
! . . .


15
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.8 COMBINACIONES
Consideremos ahora un caso importante de la combinatoria. Frecuentemente
se nos presentan situaciones en las cuales al efectuar una disposicin
de r objetos de n elementos, no nos interesa el orden de dicha
agrupacin; tal tipo de agrupaciones las denominamos combinaciones
de n objetos tomados de r en r.
1.8.1 DEFINICIN
Se llaman combinaciones de orden r en un conjunto A, las partes o
subconjuntos de r elementos del conjunto A. se denota por C
n.r ,
en
general la formula es:
C
n.r
=
n r V
r
.
!

Si reemplazamos el valor de V
n.r
por
n
n r
!
( )!
obtenemos la formula general
para calcular el nmero de combinaciones de n elementos tomados
de r en r :
C
n.r.
=
n
r n r
!
!( )!
EJEMPLO: Las combinaciones binarias de orden dos (r =2) en el conjunto
A = 'a
1
, a
2
, a
3
) es:
'a
1
, a
2
) , 'a
1
, a
3
) , 'a
2
, a
3
)
Obsrvese que si cambiamos el orden de los elementos en los
subconjuntos anteriores, no obtenemos conjuntos diferentes, razn
por la cual decimos que en las combinaciones no nos interesa el
orden.
Ahora si aplicamos las frmulas: donde n = 3, r = 2 tenemos:
16
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
C
n.r
=
n
r n r
!
!( )!
!
)!
!
!


3
2!(3 2
3
2!.1
3
EJEMPLO: Cuntos comits integrados por tres personas se pueden formar
de un conjunto de doce personas.
C
12.3
=
12!
3 12 3
12!
3 9!
1320
6
220
!( )! !.
comites
1.8.2 COMBINACIONES CON REPETICIN
En el caso de combinaciones no se permite repeticiones de sus elementos.
Si se trata de formar todas las combinaciones posibles, de orden r
elegidas entre las n, cuando los elementos pueden repetirse, se dice
que cada grupo de estos es una combinacin con repeticin de orden
r de los n elementos.
Como se trata de combinaciones, dos de ellas son distintas si difieren en
algn elemento, por lo menos.
Por ejemplo, sea 'a, b, c, ) un conjunto de 3 elementos, entonces aa, ab, bc.
etc. son distintas combinaciones con repeticin de orden 2 de 3
elementos.
La formula general para este caso es:
C
n. r
=
[ ]
( )!
! ( ) !
n r
r n r r
+
+
1
1
EJEMPLO: Se dispone de un recipiente con cuatro tipos de arandelas, A, B, C
y D, y se van a sacar muestras de 3 arandelas cada una. Cuntas
muestras distintas se pueden elegir.
SOLUCIN: Hay 4 tipos de arandelas y se van a formar grupos de 3
arandelas, donde se permite repeticiones (por ejemplo), dos grupos
distintos pueden ser A A A, A B B, dos de estos grupos son distintos
si difieren, al menos, en una arandela. Se trata de combinaciones con
repeticiones de orden 3, de 4 elementos. O sea:
17
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
C
4.3
=
[ ]
( )!
! ( ) !
!
! !
4 3 1
3 4 3 1 3
6
3 3
120
6
20
+
+

Lo que nos permite decir que podemos sacar 20 muestras distintas.
1.9 TEORA ELEMENTAL DE LA PROBABILIDAD
1.9.1 DEFINICIN DE PROBABILIDAD:
INTRODUCCIN: En el lenguaje corriente al hablar acerca de cierto suceso
formamos enunciados tales como:
Probablemente estudiar ingeniera.
Posiblemente me case en enero.
Es muy probable que pruebe el examen.
Es poco probable que gane el 2080 en la lotera del jueves.
Empleamos los trminos, probablemente, muy probable, poco probable
muchas posibilidades, en un sentido muy vago y de ninguno de los
sucesos anteriores podemos asegurar que se verifique o no. Pero
tales trminos los podemos utilizar para describir, aunque en forma
muy vaga, nuestro grado de creencia en que estos sucesos se
verifiquen.
En efecto, podemos interpretar intuitivamente el concepto de probabilidad
como una medida de la posibilidad (creencia) de ocurrencia de un
suceso.
Es frecuente el empleo de expresiones tales como: el suceso A tiene menor,
igual o mayor probabilidad de ocurrencia que el suceso B.
Pero tales afirmaciones no tendrn validez lgica mientras no podamos darle
un sentido preciso al trmino probabilidad, de tal manera que nos
permita asociarle a cada probabilidad de ocurrencia de los sucesos A
y B un nmero real.
18
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
DEFINICIN: Dado un experimento aleatorio cualquiera, que pueda dar lugar
a varios sucesos elementales igualmente posible, se define como
probabilidad de un suceso E, al cociente entre el nmero de sucesos
favorables (SF) y el nmero de suceso elementales posibles (SP).
Que denotaremos:
19
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

P (E) =
NumerodeSucesosElementalesFavorablesaE
NumerodesucesosElementalesPosibles

P (E) =
SF
SP
Esta definicin es denominada REGLA DE LAPLACE. El mtodo para
obtener una medida de un suceso se basa en experimentos
aleatorios; los experimentos ms sencillos son: lanzar una moneda al
aire, lanzar un dado, extraer una carta, seleccionar una bola de color
de una urna, extraer un nmero de una urna, etc.
OBSERVACIONES: Es muy importante darle a entender al lector que no
entiende de cartas o barajas, que en este texto trataremos de un
conjunto de naipes ( Rumis) formado por 4 tipos de cartas ; diamante,
trbol, rojo o corazn y negras; donde de cada carta hay 4, por
ejemplo existen 4 ases, 4 jotas, 4 q, 4 cinco, etc.
La probabilidad de aparicin del suceso E (llamada su ocurrencia) viene
dada por.

P(E) =
SF
SP
= p
La probabilidad de no aparicin del suceso (llamada su no ocurrencia)
viene dada por

g = p (no E) = 1 - P (E) = 1 - P
As, pues: p + q = 1 o P (E) + P (no E) = 1
El suceso no E a veces se denota por

, ,

E
E E
20
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO 1: Determinar la probabilidad p de la aparicin de un nmero impar
en una tirada de un dado equilibrado.
SOLUCIN: De los 6 casos igualmente probables (1, 2, 3, 4, 5, 6) 3 casos son
favorables cuando salga: 1, 3, 5. Entonces:
P = 3/6 = 1/2.
EJEMPLO 2: La aparicin de un as, el cinco de diamante o el tres de corazn
en una sola extraccin de una baraja de 52 cartas.
SOLUCIN: El suceso puede ocurrir de 6 formas (uno cualquiera de los ases
son 4, el cinco de diamante, y el tres de corazn) del total de 52 cartas
igualmente probables. Entonces.
p = 6/52 = 3/26
EJEMPLO 3. En el experimento aleatorio de lanzar una moneda al aire. Los
dos sucesos elementales posibles son: que salga cara ( c ) y que
salga sello (s), luego la probabilidad de cara y de sello es la misma
1/2.
P ( c ) = P (s) = 1/2.
NOTA: La probabilidad del suceso seguro E, P(E) es iguala a 1, y la
probabilidad del suceso imposible, es igual a cero, luego entre estos
dos nmeros o valores, 0 y 1 se sita la probabilidad de cualquier otro
suceso A.
0 < p (A) < 1
1.9.2 TEOREMAS DEL CLCULO DE PROBABILIDAD
1.9.2.1. PROBABILIDAD CONDICIONAL. SUCESOS INDEPENDIENTES Y
DEPENDIENTES.
21
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Dado un experimento aleatorio cualquiera que puede dar lugar, entre otros, a
los sucesos A y B, se denomina probabilidad del suceso B
condicionada al suceso A, y se representa mediante P ( B / A) y se lee
probabilidad de que ocurra el suceso B sabiendo el suceso A ha
ocurrido , o simplemente, probabilidad de B dado A.
Si el hecho de que se haya realizado el acontecimiento A no altera, en
absoluto, la probabilidad de que se realice el acontecimiento B, los
sucesos A y B son llamados Independientes y no tiene sentido
hablar de probabilidad de B condicionado A.
En este caso:
P (B/A) = P (B)
En caso contrario, se dice que los sucesos A y B son Dependiente y:
P (B/A) P (B)
Para el clculo de la probabilidad condicional P (B/A) se utiliza la siguiente
frmula:

P (B / A ) =
P B A
P A
( )
( )

, Con P(A) 0
En donde P (B A) representa la probabilidad de que se verifique a la vez
los sucesos A y B, P (A) la probabilidad de que se produzca el
suceso A.
P (B A) = P ( B / A ). P (A)
Por analoga con esta frmula puede decirse que:
P (A B) = P (A / B). P (B)
Pero por ser P (B /A ) = P ( A / B ) , ya que ambas expresiones indican por
igual la probabilidad de que se produzca a la vez los sucesos A y B,
puede escribirse indistintamente que :
P (B A) = P (A B) = P (B / A) . P (A) = P (A / B) . P (B)
22
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
De este modo se obtienen dos frmulas distintas para la probabilidad de que
se verifiquen a la vez los dos sucesos A y B de un experimento
aleatorio cualquiera.
P (A B) = P ( B / A ) . P ( A )
P (A B) = P ( A / B ) . P ( B)
Si A y B son independientes se tiene:
P (A B) = P (A ) . P ( B)
EJEMPLO1: Sea el experimento aleatorio consiste en lanzar un dado al aire.
Calcular la probabilidad de obtener un 4, sabiendo que se ha obtenido
un nmero par.
SOLUCIN: Sea A el suceso obtener un 4 al lanzar un dado y B el suceso de
obtener un nmero par al lanzar un dado, luego se trata de calcular
P ( A / B ). Aplicando la frmula correspondiente se tendr:
P ( A / B ) =
P A B
P B
conP B
( )
( )
, ( )

0
P (B) = 3/6, puesto que de los 6 resultados posibles, slo 3 (2, 4, 6) son
favorables al experimento considerado.
P (A B) = 1/6 ya que slo existe un resultado favorable, de los 6 posibles,
que sea al mismo tiempo nmero par y que coincida con el nmero
cuatro.
Por tanto:
P(A/B) =
P A B
P B
( )
( )
/
/


1 6
3 6
1
3
EJEMPLO 2. Supngase una caja que contenga 4 bolas blancas y 3 bolas
negras. Sea A el suceso de que la primera bola extrada se negra y B
el suceso de que la segunda bola extrada se negra, en extraccin sin
remplazamiento. Aqu A y B son sucesos dependiente.
23
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
SOLUCIN: P (A) =
3
4 3
3
7 +


P ( B ) = P ( B / A ) =
2
6
, puesto que de las 3 bolas negras ya sacamos
una, y de las 7 existentes han quedado 6.
Luego:
P (A B) = P ( B / A ) . P ( A ) =
2
6
3
7
6
42
1
7
.

1.9.3. AXIOMATIZACION DE LA PROBABILIDAD.
La teora de probabilidad ha sido construida partiendo de varios axiomas
como lo fue la geometra, la mecnica terica y otras ciencias. El
desarrollo axiomtico de las probabilidades que ha tenido mayor
aceptacin es el propuesto por: Andrej N. Kolmogorov (1903, ) en
1933. Kolmogorov inicia con un conjunto U de eventos simples, o
sea un espacio muestra. Luego considera una familia F de
subconjunto de U los cuales denomina eventos aleatorios. Esta familia
de eventos debe conformar lo que en el lgebra moderna se llama un
Campo de Borel. Con cada evento A del campo de eventos F hay
asociado un nmero, llamado la probabilidad del evento A, escrito P
(A) y tal que:
Axioma 1: P (A) 0 para cualquier evento A
Axioma 2: P (U) = 1
Axioma 3: P ( A B ) = P (A) + P (B), si A y B son eventos mutuamente
excluyentes.
La terna (U, F, P) se llama espacio probabilstico y representan el modelo
matemtico usado para el estudio de los fenmenos aleatorios.
A partir de los tres axiomas se deducen varias propiedades de las
probabilidades que son tiles en la solucin de problemas.
P
1
. P ( ) = 0, o sea que la probabilidad del evento imposible es cero.
24
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
P
2.
O P (A ) 1. la probabilidad es un nmero entre 0 y 1.
P
3
P ( A
C
) = 1 - P (A).
P
4 .
Si un evento A implica otro evento B, es decir, si A B, entonces
P (A) P (B).
P
5
. P (A1 U A
2
U... Ua
n
) = P (A
1
) + P (A
2
) +...+P (A
n
) cuando A
1
, A
2,
A
n
son eventos mutuamente excluyentes.
P
6
. p ( A B ) = P (A ) + P (B ) - P (A B) Cuando A y B son eventos
cualquiera. Esta probabilidad se llama regla de adicin
P
7.
P ( A - B ) = P (A) - P (A B).

En los ejemplos siguientes veremos cmo se aplican estas propiedades.
EJEMPLO 1. Una urna contiene 6 bolas blancas, 4 rojas y 5 azules de igual
tamao, se extrae una bola al azar, cul es la probabilidad de que
esta bola sea roja?
Sea R: obtener bola roja, B: obtener bola blanca y A: obtener bola azul.
Entonces:
P ( R ) =
4
6 4 5
4
15 + +

Cul es la probabilidad de que la bola sea blanca o azul?
P (A B ) = P (A) + P (B ), ( eventos mutuamente excluyentes)
P (A B ) =
6
15
5
15
11
15
+
Cul es la probabilidad de que la bola no sea azul?
P ( A
C
) = 1 - P (A)

25
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
P ( A
C
) = 1 -
5
15
10
15
2
3

EJEMPLO 2. Se extrae una carta al azar de una baraja de 52 cartas
(poker). Cul es la probabilidad de obtener un As?
Sea A: obtener un as. En las 52 cartas hay 4 ases, luego P (A) = 4/52
Cul es la probabilidad de obtener un 10 un diamante?
Sea B: obtener un diez y D: obtener un diamante. En la baraja hay 4 dieses
y 13 diamantes y una de las cartas es el 10 diamante. Entonces.
P (B) = 4/52, P (D) = 13/52 y P (B D) = 1/52. Por lo tanto
P (BD) = P (B) + P (D) - P ( B D)
P (BD) = 4/52 + 13/52 - 1/52 = 16/52
EJEMPLO 3. Se lanzan dos dados una vez. Cul es la probabilidad de obtener
una suma igual a 5 con los dados?
Sea C: obtener suma igual a 5. El espacio muestral es uno de los nmeros
del 2 al 12 pero estos nmeros no ocurren con igual probabilidad. El 5
se puede obtener cuando los dados caen: (3,2), (2,3), (1,4), (1,4) esto
es, se tienen 4 casos favorables al evento C entre los 36 posibles.
Luego:

P ( C) = 4/36.
De igual manera se obtienen las probabilidades para las otras sumas. Cul
es la probabilidad de obtener una suma al menos de 9?
Sea M: obtener al menos 9.
P (M) = P (obtener 9 10 11 12)
P (M) = P ( 9) + P (10) + P (11)+ P (12)
P (M) = 4/36 + 3/36 + 2/36 + 1/36 = 10/36
26
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO 4; Un envo de 12 cajas con drogas contienen 3 cajas alteradas.
Cul es la probabilidad de obtener una caja alterada al tomar al azar 7
cajas de las 12?
Llamaremos H dicho evento.
No es fcil resolver este problema si queremos calcular directamente el
nmero de casos favorables y posibles. En caso como ste, es
recomendable acudir a la teora del anlisis Combinatorio: entonces
razonamos as: el nmero de casos posibles es el nmero de
combinaciones de 12 cajas tomas 7 a la vez, es decir C
12.7
, las cajas
alteradas pueden seleccionarse entre las 3 alteradas en C
3.1
formas y
las 6 restantes pueden seleccionarse entre las 9 no alteradas en C
9.6
formas. Por principio fundamental, tenemos que el nmero de casos
favorables es C
3.1
C
9.6
. Luego:
P(H) =
31 9 6
12 7
. .
.
C C
C
Aplicando la frmula de combinaciones:
C
n. r
=
n
r n r
!
!( )!
C
3.1
=
3
1 3 1
3
!
!( )!

C
9.6
=
9!
6 9 6
84
!( )!


C
12.7
=
12!
7!(12 7
792


)!
Luego:
P(H) =
( )( ) 3 84
792
7
22

EJEMPLO 5. La siguiente tabla muestra al personal (animales) de un


zoolgico, tabulados por edad.
27
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ANIMALES X
25
Y
26- 30
Z
31 -35
W
>35
TOTAL
guilas 0 5 25 75 105
Bfalo 20 30 35 35 120
Caballo 3 6 6 10 25
Delfn 7 15 8 12 42
Elefante 200 375 442 203 1220
Faisn 1 12 8 3 24
Gacela 4 10 19 12 45
Hipoptamo 5 25 15 10 55
Ibis 20 35 50 25 130
28
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Totales 260 513 608 385 1766
29
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Con los datos de la tabla podemos determinar:
a) Las guilas que tienen ms de 35 aos: N (A W) = 75

b.) B Y, Consiste en los animales bfalos o los animales que estn
entre las edades de 26 y 30 o ambos, luego :
N ( B Y ) = B + Y - ( B Y) = 120 +513 - 30 = 603. Es de anotar se resto el
30 quienes son animales que ya han sido contados puesto que estn
incluidos en el nmero 120 como el 513.
c) Supngase se elige un animal al azar dentro de todos que se
representan, cul es la probabilidad de que este animal tenga 25 aos
de edad o sea ms joven?
P ( X) =
n X
n U
( )
( )
. .
260
1766
0147 015

d) Cul es la probabilidad de que un animal sea guila, dado que se elige
al azar del conjunto de animales que tienen ms de 35 aos.
P ( A / W ) =
n A W
n W
( )
( )
.


75
385
019
e.) Cul es la probabilidad de que un animal sea guila y de 25 aos de
edad o menos?.
Son eventos mutuamente exclusivos, puesto que:
A X = O, luego:
P( A X ) = P (A) + P (X) =
105
1766
260
1766
0059 0147 0206 021 + + . . . .
f) Cul es la probabilidad de que un animal elegido al azar de todos los
animales sea tanto elefante como tener una edad comprendida entre
31 - 35 aos
P (E Z ) = P (Z) . p (E/Z) = (608 / 1766) . (442 /608) = ( 0.34 ) ( 0.73) =
0.25
30
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
PROBLEMAS SOBRE LA UNIDAD 1.0
1.1 Hallar el valor de:
a) 7p
3
, 9p
2
, 8p
3
, 6p
1
,

10p
3
, 4p4

b.) 8C4, 4C4, 6C1, 9C3, 5C3, 5C3, 10C4.
NOTA: ( nCr = C n.r).
1.2 Calcular el nmero de permutaciones que se pueden formar con las
letras de la palabra matemticas.
1. 3 De cuntas maneras puede formarse un equipo de ftbol de entre un
grupo de 12 voluntarios?
1.4 De cuntas formas pueden ordenarse 6 libros en un estante, si:
a) No se da ninguna restriccin
b) 2 libros determinados deben estar juntos.
c.) Un libro determinado debe estar en el extremo izquierdo.
1.5 De un total de 5 Qumicos y 7 Bilogos, se forman un comit de 2
Qumicos y 3 Bilogos. De cuntas formas pueden formarse, si :
a.) puede pertenecer a l cualquier qumico y bilogo
b.) un bilogo determinado debe pertenecer al comit?
c.) Dos bilogos determinados no pueden estar en el comit
1.6 Un conductor de terapia de grupos en una clnica de enfermos
mentales tiene 10 pacientes de los cuales debe formar un grupo de 6.
Cuantas combinaciones de pacientes son posibles?
1.7 Un educador en asuntos sanitarios tiene 3 carteles para exhibir uno
junto al otro en la pared del vestbulo de un centro de salud.
En cuntas formas diferentes los puede disponer?
1.8 Supngase que en cierto laboratorio se tiene 4 trabajos que deben
realizarse en una tarde particular y existen 5 personas para llevarlos a
cabo. En cuntas formas pueden asignarse las 5 personas a los 4
trabajos?
31
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.9 Un investigador tiene 4 medicamentos que desea poner a prueba,
pero slo cuenta con los suficientes animales experimentales para
probar a 3 de los medicamentos. Cuntas combinaciones de
medicamentos pueden poner a prueba.
1.10 Ocho animales experimentales han sido inoculados con cierta droga;
tres con tipo A, tres con tipo B y dos con tipo C. Cada animal debe
colocarse en una de las ocho jaulas adyacentes para su observacin.
Si los animales slo se distinguen con base en el tipo que recibieron,
cuntos arreglos diferentes son posibles?.
1.11 De una baraja de pquer, cuntas manos de 5 cartas cada una se
puede sacar?
1.12 Un dado normal se lanza dos veces. Determinar la probabilidad de
obtener un seis en ambos lanzamientos.
1.13 Una urna contiene una bola blanca y una bola negra. Se extrae una
cada vez sin reposicin. Determinar la probabilidad de que la primera
bola sea blanca y la segunda negra.
1.14 Una urna contiene seis bolas negras y cuatro blancas. Se extrae sin
reposicin dos bolas, una a una. Determinar la probabilidad de
seleccionar una bola blanca en la primera extraccin y una bola negra
en la segunda.
1.15 Determinar la probabilidad de que todas las cuatros cartas extradas
aleatoriamente y sin reposicin de una baraja de 52 resulten aseas.
1.16 En una ciudad de 10.000 electores el 50% son liberales y el 50% son
conservadores. Si se seleccionan dos electores aleatoriamente cul
es la probabilidad de que ambos sean liberales?.
1.17 Supngase que P (A) = y P (B) = , encontrar p ( AB ) si:
a.) A y B son independiente
b.) A y B son mutuamente excluyentes.
1.18 Si la P (A) = 1/3, P (B) = y P (A/B) = 1/2, en contar P ( A + B)
32
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.19 A y B juegan 12 partidas de ajedrez, de los cuales A gana 6 veces,
B gana 4 y 2 terminan en tabla. Acuerdan jugar un torneo consistente
en 3 partidas. Hallar la probabilidad de que:
a.) A gane 3 partidas
b.) D os partidas terminan en tabla
c.) A y B ganen alternativamente.
d.) B gane al menos un partida
1.20 Se extrae una bola al azar de una caja que contiene 10 rojas, 30
blancas, 20 azules y 15 naranjadas. Hallar la probabilidad de que:
a) sea naranja o roja
b) no roja o azul
c.) no azul
d.) blanca
e ) roja, blanca o azul
1.21 Un pescador atrapa 10 peces, 3 de los cuales son ms pequeos que
los permitidos por la ley. Un polica se le acerca y examina la pesca,
pero mirando 2 peces solamente elegidos al azar. Cul es la
probabilidad de que el pescador sea multado?
1.22 De acuerdo con la tabla del ejemplo 5 de la presente unidad, calcular
a.) P (F W), P ( H / Z ) , P ( G C ) , P (I /Y)
1.23 Un joven tiene en su bolsillo una moneda de 10 centavos, una de 20,
una de 25, una de 50 y otra de un peso. Al sacar simultneamente dos
monedas que posibilidad existe que:
a.) El joven saque menos de 80 centavos
b.) Saque ms de 50 centavos
c.) Saque al menos 10 centavos
1.24 La siguiente tabla muestra la distribucin de un grupo de personas:
SEXO
GRUPO
SANGUNEO MASCULINO FEMENINO TOTAL
0 113 113 226
A 103 123 226
B 40 37 77
33
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
AB 30 20 50
Total 286 293 579
Para este grupo calcular:
a) La probabilidad de que un paciente elegido al azar sea femenino.
b.) Sea femenino o Masculino
c) Sea masculino y de grupo B.
d.) Sea femenino de grupo A.
e) La probabilidad de que un paciente sea elegido de grupo AB
f.) De que un paciente sea elegido de los masculinos, dado que es
grupo O.
1.25. Supongamos que la probabilidad de nacer varn es 0.51 y que se
estudia familias con tres hijos. Se elige al azar una familia, hallar la
siguiente probabilidad:
a.) Que todos sean varones.
b) Que uno de los hijos sea mujer
c.) Que todos sean mujeres.
Asuma que hay independencia entre los nacimientos
1.26 Se lanzan 2 dados. Determinar la probabilidad que :
a.) La suma de los puntos sea 8
b) La suma de los puntos es menor que 5.
c) La suma sea mayor que 12.
1.27 En un paquete hay 9 semillas de las cuales 2 producen flores blancas,
3 producen flores rojas y 4 producen flores amarillas.
Se extraen al azar dos semillas y se siembra. Calcular la probabilidad de que
:
a.) Ambas produzcan flores blancas.
b) Una produzca flor blanca y la otra roja
c. ) Ambas produzcan flores del mismo color.
1.28 Un club de seorita tiene 120 socias con las siguientes caractersticas:
34
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
35
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
COLOR DE OJOS RUBIAS TRIGUEAS MORENAS PELIROJAS
Azul 8 4 8 7
Caf 5 18 20 6
Verde 9 23 8 16
Un apuesto joven llama al club y concreta una cita con una de ellas para ir al
concierto. Calcular la probabilidad de que la seorita:
a.) Sea triguea y de ojos verde.
b.) Sea pelirroja
c.) Sea morena y de ojos caf o verde
d.) Sea rubia y de ojos azules
e.) Sea rubia o morena sabiendo que tiene ojos verde.
1.29 Una rata debe atravesar un laberinto de tres secciones como se ve en
la figura. En la primera seccin hay dos caminos, uno de ellos con
comida. En la segunda hay tres caminos y al pasar por uno de ellos la
rata recibe un choque elctrico. La tercera seccin consta de cuatro
caminos y en un de ellos tambin encuentra comida. Calcule la
probabilidad de que la rata atraviese el laberinto comiendo dos veces
y sin sufrir un choque elctrico
Comida Choque Comida

1.30 Empricamente se ha estimado que la probabilidad de que germine
una semilla de Olmo Americano es 0.63 y de que germine una semilla
de Abeto es 0.56. Si se siembra una semilla de olmo y otra de Abeto.
Calcular la probabilidad de que :
a.) Germine al menos una de ellas
b.) no germine ninguna
c.) Germine la semilla de olmo y no la de abeto.
36
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1.31 El 60% del ganado de una regin fue vacunado contra un tipo especial
de enfermedad. La probabilidad que tiene un animal de recuperarse
es 1 en 5 si fue vacunado y de 1 en 20 si no fue vacunado. Un animal
tomado al azar estaba enfermo pero se recupero. Calcular la
probabilidad de que ste animal haya sido vacunado.
1.32 Se tienen dos lpices uno blanco y otro negro, las caras de ellos estn
numeradas 1, 2, 3, 4. Se hecha a rodar al piso para leer sus caras
superiores.
a.) Establezca el espacio muestra
b.) Determine la probabilidad de que la cara superior de los lpices
sea una suma de 1 3
c.) La suma de sus caras sea 4.
d.) La suma de sus caras sea un nmero par
e.) La suma de sus caras sea un nmero impar
37
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
UNIDAD 2.0
DISTRIBUCIN DE PROBABILIDAD
OBJETIVO
DE LA UNIDAD: Desarrollar una comprensin del concepto de esperanza matemtica y
sus aplicaciones en la toma de decisiones y mostrar cmo ciertos tipos de datos pueden
ser representados por tipos particulares de modelos matemticos.
CONTENIDOS
2.1 Variables Aleatorias
2.2 Esperanza Matemtica
2.3 Distribuciones de Probabilidades
2.3.1 Poisson
2.3.2 Binomial
2.3.3 Normal
Ejercicios
38
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.1. VARIABLES ALEATORIAS
Es tambin llamada variable ESTOCASTICA y es una variable estadstica
que asume cada uno de sus valores numricos posibles con una
probabilidad definida.
Siempre que se determina la estatura, el peso o la edad de un individuo, con
frecuencia se dice que el resultado es un valor de la variable
respectiva. Cuando los valores obtenidos son el resultado de factores
fortuitos, se dice que la variable es una variable aleatoria.
Frecuentemente se da el nombre de observaciones o, simplemente, el de
medidas a los valores que resultan de procedimientos de medicin.
Los valores de las variables aleatorias difieren porque en su observacin
escapan a nuestro control las diferencias casuales.
Los siguientes son algunos ejemplos de variables aleatorias:
2.1.1. La velocidad de una molcula de gas, Varan en cada choque
molecular y cada choque, a su vez, depende de muchos factores.
2.1.2. El nmero de meteoritos que penetran en la atmsfera y alcanzan la
superficie terrestre.
Siempre es variable debido a factores de carcter aleatorios.
2.1.3. El peso de los gramos de caf cultivados en determinada regin.
Es variable en virtud de numerosos factores, tales como calidad del suelo y
semilla, riego, condiciones ambientales etc.
2.1.4. Momento en que se presenta las desintegraciones atmicas.
Estos momentos se presentan al azar y son independientes entre s.
2.1.5. Nmero de llamadas a una central telefnica durante un ao.
2.2. ESPERANZA MATEMTICA
39
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La esperanza matemtica de una variable aleatoria, es llamada comnmente
valor medio, valor esperado, o media, se define como una media
ponderada de la poblacin en donde las ponderaciones son las
probabilidades de los valores de la variable aleatoria. En otras
palabras, la esperanza matemtica es un promedio probabilistico de
los valores de la variable aleatoria.
Si P es la probabilidad de que una persona reciba una suma de dinero s, la
esperanza matemtica o simplemente la esperanza, se define como:
ps.
Si X representa una variable aleatoria discreta que puede tomas los valores
X
1
, X
2,
X
3 ,....,
X
k
con probabilidades respectivas p
1
, p
2,
p
3 , .. .
p
K
, donde
P
1
+ P
2
, P
3
, +... + P
K
= 1, la esperanza de X simbolizada por
E (X), se define como:
E ( x ) = P
1
X
1
+ P
2
X
2
+ P
3
X
3
+... +P
K
X
K
=
j
j
j
k
p
x
px

1
Si las probabilidades p
j
en esta esperanza se sustituyen por las frecuencias
relativas f
j
/ N, donde N =f
j
, la esperanza se reduce a (FX)/N, que
es la media aritmtica (
X
__
).
Cuando N crece, las frecuencias relativas F
j
/ N se aproximan a las
probabilidades p
j
. Esto conduce a interpretar que E (X) representa la
media de la poblacin de la que se ha extrado la muestra.
Si se denota por
X
__
la media de la muestra, la media de la poblacin
vendr representa por la correspondiente letra griega ( ).
La esperanza tambin puede definirse para variables aleatorias continuas,
pero la definicin no requiere la utilizacin de clculo avanzado.
EJEMPLO 1: Si la probabilidad de que una persona gane un premio de
$ 450.000 es 0.5 su esperanza es (0.5) (450.000) = 225.000.
EJEMPLO 2: Si un hombre compra una boleta de rifa, en la que puede ganar
un primer premio de $ 70.000. un segundo premio de $ 40.000 con
posibilidades 0.002 y 0.005 respectivamente. cul es el precio justo a
pagar por la boleta de rifa .
40
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
E (X) = ( 70.000) (0.002) + (40.000) ( 0.005 ) = $ 140 + $ 200 = $340.
Luego el precio justo a pagar por la boleta de rifa es de $ 340.
EJEMPLO 3: Una Compaa de seguros piensa asegurar un carro en $
800.000. La compaa estima que puede haber un prdida total del
vehculo con una probabilidad de 0.009, daos en el 50% del vehculo
con una probabilidad de 0.030 y daos en un 25% del vehculo con
una probabilidad de 0.07. Cunto debe cobrar la compaa por una
pliza de este tipo si desea ganar $ 2.500?
E (X) = (800.000) (0.009) + ( 400.000) (0.030 ) + (200.000) (0.07) =
7.200 + 12.000 + 14.000 = $ 33.200.
La compaa de seguros deber cobrar $ 33.200 + 2.500 = 35.700 Por la
pliza para asegurar la ganancia programada.
2.3. DISTRIBUCIN DE PROBABILIDADES
Cuando a una variable aleatoria se asocia la probabilidad, de tal manera que
a cada valor de la variable le corresponde su respectiva probabilidad,
se ha determinado una distribucin de probabilidad .
Puesto que toda variable aleatoria tiene una distribucin de probabilidades,
diremos que las variables aleatorias discretas tienen distribuciones
discretas de probabilidades y las variables aleatorias continuas tienen
distribucin continua de probabilidades.
Entre las distribuciones de probabilidades, algunas son tan conocidas y
usuales que tienen nombre propio. por ejemplo, las distribucin
binominal, la distribucin de Poisson, la distribucin Hipergeometrica,
la distribucin geomtrica, la distribucin binominal negativa. etc.
entre las discretas.
Entre las distribuciones continuas tenemos la distribucin Normal, la
distribucin Exponencial, la distribucin Gamma, la distribucin Beta,
la distribucin Uniforme, etc.
A continuacin veremos las distribuciones de probabilidades de uso ms
generalizado, como: binominal, normal y de poisson.
41
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.3.1 LA DISTRIBUCIN BINOMIAL
Nos permite determinar la probabilidad de que un suceso se presente
exactamente x veces en repetidos ensayos.
Es una de las distribuciones de probabilidad que se encuentra con ms
frecuencia en la estadstica aplicada. Se obtiene de un procesos
conocido como ensayo de BERNOULLI, en honor del matemtico
suizo JAMES BERNOULLI (1654-1705), quien realizo importantes
contribuciones en el campo de la probabilidad incluyendo, en
particular a la distribucin Binomial.
Cuando un solo ensayo de algn proceso o experimento puede concluir slo
a uno de los resultados mutuamente exclusivos, tales como muerto o
vivo, enfermo o saludable, masculino o femenino, el ensayo se conoce
como ensayo Bernoulli.
Para la aplicacin de la distribucin binomial se deben tener en cuenta los
siguientes criterios.
2.3.1.1.-Debe existir un nmero exacto de pruebas repetidas. Este nmero
corresponde a los N ensayos.
2.3.1.2.-Cada prueba realizada debe tener dos posibilidades de resultados
(cara o sello ). por eso es binomial.
2.3.1.3.-La probabilidad de xito ( p ) en un solo ensayo es un nico nmero.
Este determina la probabilidad de fallo o fracaso ( 1 - p ) denota por
( q ) donde q = 1 - p .
6.3.1.4.-Cada prueba o ensayo realizado es independiente de los dems.
2.3.1.5.-Se trata de determinar la probabilidad de xito, exactamente, x
ensayos o pruebas.
Si p es la probabilidad de ocurrencia de un suceso en un solo ensayo
(llamada probabilidad de xito ) y q = 1 - p es probabilidad de que el
suceso no ocurra en un solo ensayo ( llamada probabilidad de fallo ),
entonces la probabilidad de que el suceso se presente exactamente
X veces en N ensayos ( es decir , X xitos y N - X fallos ) viene dado
por :
42
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
P(X) =
N
C
X
. P
X
.q
N - X
=
N
X N X
X
N X
P
q
!
!( )!

Donde X = O,1, 2,...,N y N! = N (N - 1) ( N - 2 )..... 1


Se llama distribucin binomial, puesto que para X = 0, 1, 2,. . ., N,
corresponde sucesivo trminos de la frmula binomial o desarrollo
binomial:
(q + p )
N
= q
N
+
N
C
1
q
N-1
p +
N
C
2
q
N-2
p
2
+...+p
N

Donde 1,
N
C
1
,
N
C
2
son los coeficientes binominales
2.3.1.5 ALGUNAS PROPIEDADES DE LA DISTRIBUCIN BINOMIAL.
Media = NP
Varianza S
2
= NPq
Desviacin Tpica S = Npq
Coeficiente de sesgo
3
=
q p
Npq

Coeficiente de curtosis
4
= 3 +
1 6 pq
Npq
EJEMPLO1: La probabilidad de obtener exactamente 3 caras en 7
lanzamientos de una moneda es:
P ( x = 3 ) =
7
C
3
(1/2)
3
(1/2)
7-3
=
7!
3 4!
5040
6 16
1
128
0 41
7
1 2
!. ( )( )
. .
( / )

EJEMPLO 2. la probabilidad de obtener al menos 4 cara en 6 lanzamiento de
una moneda es :
p ( x = 4 ) + (p (x = 5 ) + ( p (x = 6) =
6
C
4
(1/2)
4
(1/2)
6-4
+
6
C
5
(1/2)
5
(1/2)
6-5
+
6
C
6
(1/2)
6
(1/2)
6-6
=
15
64
6
64
1
64
22
64
0 34 + + .
43
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO 3. Se inyecta una droga txica a 5 conejos. Se sabe que la droga es
mortfera en un 70% de los casos, cul es la probabilidad de que
mueran 3 de los 5 conejos?
En este caso: N = 5 , X = 3, P = 0.7 , q = 0.3 luego :

P (X = 3) =
5
C
3
( 0.7)
3
(0.3)
2
= 0.3087
Cuando la funcin binomial es
P ( X r ) =
x o
r

N
C
X
p
X
q
N - X
Dicha funcin est tabulada para diferentes valores de N y P, y se conoce
como tabla de la distribucin binomial. Mediante el siguiente ejemplo
veremos como se maneja dicha tabla.
EJEMPLO 1. Por estudios hechos anteriormente se sabe que 25 de cada 100
personas de una poblacin pertenecen al grupo sanguneo B. Cul es
la probabilidad de que mximo 5 de 20 donantes tomados al azar
tengan sangre tipo B?
Los parmetros son N = 20 y p = 0.25 entonces:
P(mximo 5 con sangre tipo B) = P(5 o menos) = P( X 5)
P (X 5) = P( X = 0 ) + P( X=1 ) + P( X = 2) + P(X=3) + P (X=4 ) + P( X=5 ).
El clculo de esta suma es larga y engorroso. Afortunadamente disponemos
de tablas de la distribucin binomial en donde encontraremos que
para

N = 20, r = 5 y P = 0.25: la suma vale 0.6172 luego:
P ( X 5 ) = 61.72%
b.) Cul es la probabilidad de que al menos 3 de los 20 donantes tengan
sangre tipo B ?.
44
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
P ( 3 o Ms) = P ( X 3 )
= 1 - P ( X 3)
= 1 - P (X 2)
= 1 - 0.0913
= 0.9087
Debemos tener presente que la tabla da nicamente sumas o valores
acumulados de la forma p ( X r ). Cualquier otra expresin que se
tenga, debe transformarse en sta antes de buscar los valores en la
tabla.
c.) Cul es la probabilidad de que exactamente 3 de los 20 donantes
tenga sangre tipo B ?.
P ( X = 3 ) = P( X 3 ) - P( X 2 )
= 0.2252 - 0.0913
= 0.1339 = 13.39%
La distribucin binomial se encuentra tabulada para valores de N menores
que 30 y unos pocos valores de P. cuando N es muy grande y P es
pequeo, o en general cuando los valores no se encuentran en la
tabla, los clculos deben hacerse con una calculadora, o tambin
aproximando el resultado mediante la distribucin de poisson.
2.3.2. DISTRIBUCIN DE POISSON
Otro modelo probabilstico discreto de gran utilidad en estadstica es este
modelo, ideado por el francs SIMEON DENIS POISSON (1781,
1840) y publicado en 1837. Esta distribucin ha sido usada para
describir el comportamiento de eventos raros por la que se le llama
tambin ley de los eventos improbables.
45
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
El modelo de poisson sirve para describir una serie de fenmenos cuyos
eventos se presentan como resultados al azar ya sea en el tiempo, en
el espacio o el volumen. Algunos ejemplos de estos resultados
pueden ser el nmero de : accidente de trnsito durante un perodo de
tiempo dado, personas con enfermedades raras que llegan
mensualmente a un hospital, llamadas telefnicas recibidas por una
central cada minuto, partculas emitidas por segundo por una
sustancia radiactiva, glbulos rojos por volumen en una muestra de
sangre, barcos que llegan semanalmente a un puerto, defectos por
m
2
de tela , ptalos adicionales en flores que tienen 5 ptalos
normales, etc. este numero varan aleatoriamente con el tamao de la
muestra o con el intervalo de tiempo considerado.
Las caractersticas comunes a estos fenmenos que nos permite
reconocerlos como fenmenos poissonianos son :
2.3.2.1. Las ocurrencias de los eventos en intervalos no traslapados son
independientes.
2.3.2.2. La probabilidad de ocurrencia de un solo evento en un intervalo o
espacio pequeo es pequea y es proporcional al tamao del intervalo
o espacio considerado.
2.3.2.3. La probabilidad de dos o ms ocurrencia del evento en un intervalo
o espacio pequeo es despreciable o se supone igual a cero.
Una particularidad interesante de la distribucin de poisson es el hecho de
que la media y la varianza son iguales.
La funcin de densidad de poisson viene dada por la siguiente frmula :
P (X) =
X
e
X


!
, con X = 0, 1, 2,...
donde la letra griega (lambda ) se llama parmetro de la distribucin y es
el nmero promedio de ocurrencia del evento aleatorio en el intervalo.
El smbolo e = 2.71828.
Los valores de p (x) pueden calcularse mediante una tabla que da los
valores de e
-
para distintos valores de o mediante logaritmo.
46
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.3.2.1 ALGUNAS PROPIEDADES DE LA DISTRIBUCIN DE POISSN
Media =
Varianza S
2
=
Desviacin S =

Coeficiente de sesgo
3
= 1/

Coeficiente de curtosis
4
= 3 + 1/
EJEMPLO 1.Un ctodo emite electrones a una rata promedio de 10
13
electrones por segundo. Hallar la probabilidad de que no se emita
ningn electrn durante un intervalo de 1 segundo.
P (0) =
( )
( )
( )
( )
13
0
10
13
13
13
10
0
10
1
10
e
e
e


!
EJEMPLO 2. Los registros del hospital revelan que, durante este perodo, las
Administraciones de emergencia han sido, en promedio, de 3 por da.
Encontrar la probabilidad de que:
a.) En un da dado, ocurran exactamente dos admisiones de emergencia.
P (X = 2) =
2 3
3
2!
0 224

e
.
b.) En un da particular, no ocurra admisin de emergencia alguna.
P (X = 0 ) =
0 3
3
0
005

e
!
.
47
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
c.) En un da particular sean administracin tres cuatro casos de
emergencia.
P (X = 3 ) + P (X = 4 ) =
3 3 4 3
3 3
3 4!
0 224 0168 039

+ +
e e
!
. . .

EJEMPLO 3.En un estudio de cierto organismo acutico, se tomaron gran
nmero de muestra de un estanque y se cont el nmero de
organismos que haba en cada muestra. Se encontr que el nmero
promedio organismo por muestra era de dos. Suponiendo que el
nmero de organismo est distribuido segn poisson, encontrar la
probabilidad de que:
a. La siguiente muestra que se toma tenga uno o ms organismos.
P ( X 1) = 1 - P ( X = O )
En la tabla se ve que, cuando = 2 la probabilidad de que X = 0 es de
0.1553. Por lo tanto

P ( X 1) = 1 - 0.1353 = 0.865

b. La siguiente muestra que se toma tenga exactamente 3 organismos.

P ( X = 3 ) = P (X 3 ) - P ( X 2 )

= 0.8571 - 0.6767
= 0.18
2.3.3. DISTRIBUCIN NORMAL
Entre las distribuciones continuas de probabilidades, la distribucin normal es
la ms conocida, usual y til en Estadstica. Esta distribucin fue
descubierta por ABRAHANADE MIVRE (1667, 1754) un protestante
francs que debi huir a Londres, y quien, en 1733 encontr la
distribucin normal como el lmite de la distribucin binomial cuando N
tiende a infinito. Tambin
48
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
se atribuye la paternidad de la distribucin normal a LAPLACE (1749 , 1827
) y a GAUSS ( 1777, 1855 ) por lo que se dice a veces distribucin
gaussiana en vez de distribucin normal. El hecho es que,
histricamente, la distribucin la distribucin normal est relacionada
con la teora de errores en la medicin, teora fundada por Gauss y
Laplace en una fecha posterior a la investigacin de Moivre.
La distribucin normal es un modelo probabilstico apropiado para el estudio
de muchas variables aleatorias continuas tales como la estatura de los
estudiantes de una universidad, el peso de objetos de una misma
naturaleza, el contenido en volumen de un frasco de jarabe, los
errores en la medicin de una misma magnitud fsica, el dimetro de
alguna parte para ensamblaje, la duracin de las bateras y bombillas,
etc.
La densidad normal est dada por:

y
s
s
X
e


1
2
1
2
2
2

( ) /
Donde es la media, S desviacin tpica, = 3.14159
2.3.3.1. REPRESENTACIN GRFICA
Grficamente la distribucin normal se representa mediante una curva en
forma de campana, llamada curva de probabilidad, campana de
Gauss o curva de error. El rea bajo la curva normal es igual a uno
(1) al 100%. La media () se encuentra localizada en el centro
(punto medio de x) y divide la curva en dos sectores iguales, es decir,
la curva es simtrica respecto a su media.
El rea bajo la curva normal entre dos ordenadas X = a y X = b, siendo
a b, representa la probabilidad de que x se encuentre entre a y b lo cual
se denota por p ( a x b ).
50%
49
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

Z
X


Z
Z1 Z2
X
a b
2.3.3.2. TIPIFICACIN DE DATOS
Para hallar el rea bajo la curva normal se introduce una nueva variante
estadstica (Z ), es decir, se hace necesario, tificar o estandarizar la variable
X cuando X viene expresada en unidades de desviacin.
La tipificacin de datos se efecta mediante la aplicacin de la siguiente
frmula
Z
X
S


La anterior frmula antes expuesta para la densidad normal quedar
reducida as:
Z
X
S


y
Z
e


1
2
1
2
2

50
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Las reas bajo la curva normal, para los diferentes valores de Z, se
encuentran en una tabla normal tpica de 0 a z.
2.3.3.3. PROPIEDADES DE LA DISTRIBUCIN NORMAL
2.3.3.3.1.-Los trminos tienden a agruparse alrededor del puntaje cero .
Esto quiere decir que a medida que los trminos se apartan del eje vertical,
la curva decrece.
2.3.3.3.2.-La curva normal es simtrica respecto a su eje vertical.
La altura de la curva para Z = a, exactamente igual a la altura para Z = - a.
2.3.3.3.3 Los extremos de la campana son asntotas, lo cual significa que por
ms que se prolonguen nunca se intersectan con el eje horizontal
2.3.3.3.4 La media se localiza en el puntaje Z = O, ya que es el punto de
equilibrio de la distribucin
Segn la propiedad de simetra, el eje vertical divide exactamente por la
mitad el rea bajo la curva, o sea que la mitad de los trminos se
ubica a cada lado de la vertical. All se localiza, por tanto, la mediana.
51
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La moda se sita en el mximo de la curva, que es el punto correspondiente
al puntaje Z = 0
Media = NP
Varianza S
2 =
Npq
Desviacin tpica S = NPq
Coeficiente de sesgo
3
= 0
Coeficiente se curtosis
4
= 3
Desviacin media S =
2

= 0,79795
EJEMPLOS 1:
1. Determinar el rea bajo la curva normal entre Z = -1 y Z = 1,
Z = -2 y Z = +2, Z= -3 y Z = +3.
SOLUCIN:
rea para Z = 1 es 0.3413 (segn tabla)
rea para Z = -1 es 0.3413
rea total 0.6826 que equivale a 68.26%
rea para Z = 2 es 0.4772
rea para Z =-2 es 0.4772
rea total 0.9544 que equivale a 95.4%
rea para Z = 3 = 0.4987
rea para Z= 3= 0.4987
rea total 0.9974 que equivale a 99.74%
Un grfico de esta curva normal tipificada es:
52
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

-3 -2 -1 0 1 2 3

68.26%
95.44%
99.74%
EJEMPLO 2.
Un fsicoterapeuta nota que las calificaciones que se obtienen en cierta
prueba de habilidad manual estn distribuidas aproximadamente en
forma normal, con una media de 10 y una desviacin estndar de 2.5
si un individuo elegido al azar realiza la prueba, cul es la probabilidad
de que obtenga una calificacin de 15 o ms?
SOLUCIN:
Tracemos el rea correspondiente a esta distribucin y sombremosla,
S

=10 15
En este caso X = 15, = 10 y S = 2.5, por lo tanto aplicamos:
Z
X
S

15 10
2 5
2
.
Luego el rea para Z = 2 es:
53
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
P (X 15) = P (Z 2) = 0.5 - 0.4772 = 0. 0228
EJEMPLO 3.Supngase que se sabe que los pesos de cierto grupo de
individuos estn distribuidos aproximadamente en forma normal con
una media de 70 Kg. y una desviacin estndar de 12.5 Kg. Cul es la
probabilidad de que una persona elegida al azar de este grupo pese
entre 50 y 85 Kg?
SOLUCIN:
P (50 X 85) =
P Z
50 70
12 5
85 70
12 5

_
,

. .
= P( -1.6 Z 1.2 )
= P( -1 .6 Z O ) + P ( O Z 1.2)
= 0.4452 + 0.3849
= 0.8301
2.4.- RELACIN ENTRE LAS DISTRIBUCIONES BINOMIAL Y NORMAL
Si N es grande y ni p ni q estn muy prximo a cero, la distribucin binomial
puede aproximarse estrechamente a la distribucin normal con
variable tipificada por:
Z
X NP
NPq


La aproximacin es tanto mejor conforme aumenta N, y en el lmite es total .
Esto se ve claramente en las propiedades de las distribuciones que al
aumentar N, el sesgo y la curtosis de la distribucin Binomial se
aproximan a los de la distribucin Normal. En la prctica, la
aproximacin es muy buena si ambos Np y Nq son superiores a 5.
2.5 RELACIN ENTRE LAS DISTRIBUCIONES BINOMIAL Y DE POISSON
54
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
En la distribucin binomial, si N es grande, mientras que la probabilidad P de
ocurrencia de un suceso est cerca de cero, de modo que q = (1 - p)
est cerca de 1, el suceso recibe el nombre de raro . En la prctica
se puede considerar un suceso como raro si el nmero de
repeticiones del experimento (ensayos) es al menos 50 (N 50)
mientras que Np es menor que 5. En tales caso la distribucin
binomial se aproxima mucho a la distribucin de poisson con = Np.
Esto se ve comparado las dos propiedades de cada una de las
distribuciones y sustituyendo = Np, q 1 y p 0.
Puesto que existe una relacin entre las distribuciones binomial y normal, se
deduce que hay tambin una relacin entre las distribuciones de
poisson y normal. Puede en efecto ponerse de manifiesto que la
distribucin de poisson se aproxima ala normal con variable tipificada.
X

Cuando crece indefinidamente.


55
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
PROBLEMAS SOBRE LA UNIDAD 2.0
2.1 Responda las preguntas siguientes:
a.) Que se entiende por distribucin de probabilidades de una
variable aleatoria?
b.) Cmo se diferencian las variables aleatorias discretas de las
continuas?

c.) Qu es una variable aleatoria ?
d.) Pueden estudiar las probabilidades sin necesidad del concepto
de variable aleatoria ?. Discuta su respuesta.
ESPERANZA MATEMTICA
2.2 En un negocio determinado un hombre puede tener un beneficio de
$ 379.000 con probabilidad 0.6 o una prdida de $ 120.000 con probabilidad
0.4. Determinar su esperanza.
2.3 Hallar ( a ) E ( X ), ( b ) E ( X
2
), ( c)
E X
X
(
__
)

1
]
1
1
2
para la
siguiente distribucin de probabilidad.
X : 9 14 16 23 37
P ( X) : 1/7 1/5 4/5 3/7 1/9
2.4 Cual es precio justo a pagar para entrar en un juego en el que uno
puede pagar $ 5.000 con probabilidad de 0.4 y $ 3.500 con
probabilidad de 0.6.
2.5 Si llueve, un vendedor de paraguas puede ganar $ 130.000 por da. Si
no llueve, puede perder $ 56.000 por da, cual es su esperanza
matemtica si la probabilidad de lluvia es 0.4.
56
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.6 Se ha estimado que siguiendo cierta dieta y cierto tipo de ejercicios,
una persona robusta pierde 1.0 kg de su peso por semana con
probabilidad 1/2, pierde 1.5 kg con probabilidad 1/4, pierde 2.0 kg con
probabilidad 1/6 y pierde 2.5 kg con probabilidad 1/12. Halle la prdida
de peso esperada por semana para una persona sometida a dicha
dieta.
2.7 Una lotera del pas vende 10.000 billetes cada uno de 100 fracciones
a un costo de $ 200 por fraccin. Cada fraccin ganadora recibe un
premio de $ 300.000. Si una persona acostumbra comprar una
fraccin de esta lotera, cunto espera ganar en promedio semanal?
DISTRIBUCIN BINOMIAL

2.8 Un vendedor de seguros vende pliza a 5 hombres, todos de las
misma edad y con buena salud. De acuerdo con las tablas actuariales,
la probabilidad de que un hombre de esta edad viva 30 aos ms es
2/3. Hallar la probabilidad de que a los 30 aos vivan:
a.) Los 5 hombres,
b.) Al menos 3
c.) Solamente 2
d.) Al menos 1.
2.9 Supngase que el 24 por ciento de cierta poblacin tiene el grupo
sanguneo B. Para una muestra de tamao 20 extrada de una
poblacin, encontrar la probabilidad de que:
a.) Se encuentren exactamente tres personas con grupo
sanguneo B.
b.) Se encuentren tres o ms personas con las caracterstica de y
inters.
c.) Se encuentren menos de tres .
2.10 Supngase que se sabe que la probabilidad de recuperacin de cierta
enfermedad es de 0.4. Si 15 personas contraen la enfermedad, cul
es la probabilidad de que:
a.) Tres o ms se recuperen?.
b.) Cuatro o ms?
c. ) Menos de cinco ?
57
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.11 Supngase que la tasa de mortalidad para cierta enfermedad es del
0.10 y supngase que la contraen 9 personas de la comunidad. Cul
es la probabilidad de que:
a.) Ninguna sobreviva?
b) El cincuenta por ciento muera?
c. ) Al menos tres mueran.
2.12 El 80% de los cerdos de una regin est infectado con triquinosis. Se
examinan 20 cerdos de esa regin, halle la probabilidad de que:
a.) A lo sumo 12 estn infectados.
b.) Haya entre 13 y 16 cerdos infectados
c.) Haya ms de 14 cerdos infectados.
2.13 Las gallinas ponen huevos fecundos entre las 24 y las 28 horas
siguientes a su apareamiento. La vida de los espermatozoides en el
cuerpo de la gallina puede prolongarse de 15 a 20 das despus. En
un experimento realizado para determinar la fecundidad de los huevos
puestos por las gallinas despus de estar separadas del gallo, se
encontr que pasado cuatro das de separacin, el 70% de los huevos
resultaron fecundos. Si se toman 15 huevos al azar, halle la
probabilidad de que todos resulten fecundo y la probabilidad de que
no menos de 10 resulten fecundos.
DISTRIBUCIN DE POISSON
2.14 Supngase que se sabe que en cierta rea de una gran ciudad, el
nmero promedio de ratas por manzanas de casas es de cinco .Su
poniendo que el nmero de ratas se distribuye segn poisson,
encuentre la probabilidad de que en una manzana elegida
aleatoriamente:
a.) Se tenga exactamente cinco ratas.
b.) Ms de cinco ratas.
c.) Menos de cinco ratas.
d.) Entre cinco y siete ratas, inclusive.
2.15 Supngase que durante un periodo de varios aos, el nmero
promedio de muerte debida a cierta enfermedad no contagiosa ha sido
de diez. Si el nmero de muertes debidas a esta enfermedad sigue la
distribucin de poisson, cul es la probabilidad de que durante el ao
que transcurre:
58
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
a.) Mueren exactamente siete personas de esa enfermedad
b.) Mueran diez o ms personas
c.) Nadie muera de esa enfermedad.
2.16 Si el nmero medio de accidentes graves por ao en una fbrica (el
nmero de empleados es constante) es de cinco, encontrar la
probabilidad de que en el ao en curso:
a.) Se tenga exactamente siete accidente.
b.) Diez o ms accidente
c.) Ningn accidente
d.) Menos de cinco accidente.
2.17 En un estudio sobre la efectividad de un insecticida contra cierto
insecto, se roci un rea grande de tierra, posteriormente se examino
el rea en relacin con los insectos vivos, seleccionando lotes
cuadrados al azar y contando el nmero de insectos vivos por lote
cuadrado. Experiencias anteriores han demostrado que el promedio
de insectos vivos por lote cuadrado despus de haber rociado, es de
0.5. Si el nmero de insectos vivos por lote cuadrado se distribuye
segn poisson, cul es la probabilidad de que un lote cuadrado
elegido contenga:
a.) Exactamente un insecto vivo.
b.) Menos de cuatro.
c.) Mas de un insecto.
2.18 Se ha estimado en un 0.5% el nmero de nacimientos de nios vivos
con alguna anomala cromosmica. Cul es la probabilidad de que en
los prximos 2.000 nios que nazcan vivos hayan por lo menos 10 con
anomalas cromosmica.
2.19 Si el 3% de las bombillas fabricadas por una compaa son
defectuosas, hallar la probabilidad de que en una muestra de 100
bombillas, sean defectuosas
a.) 5 Bombillas
b.) Ms de cinco
c.) Entre 1 y 3
d.) Menos de 4.
DISTRIBUCIN NORMAL
2.20 Hallar el rea bajo la curva normal:
a.) A la izquierda de Z = - 1.78
b.) A la izquierda de Z = 0.56
59
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
c. ) A la derecha de Z = -1.45
d.) A la correspondiente a Z 2.16
e.) Correspondiente a - 0.80 Z 1.53
f.) A la izquierda de Z = -2.52 y a la derecha de Z = 1.83
2.21 Si la altura de 300 estudiantes se distribuyen normalmente con media
68 pulgadas y desviacin tpica de 3 pulgadas, cuntos estudiantes
tienen alturas:
a.) Mayor de 72 pulgadas.
b.) Menor o igual a 64 pulgadas
c.) Entre 65 y 71 pulgadas inclusive.
d.) Igual a 68 pulgadas.
2.22 Supngase que las edades en la que se adquieren cierta enfermedad
estn distribuidas en forma aproximadamente normal con una media
de 11.5 aos y una desviacin estndar de 3 aos. Un nio acaba de
contraer esta enfermedad. Cul es la probabilidad de que el nio
tenga:
a.) Entre 8 y 14 aos de edad.
b.) Ms de 10 aos de edad
c. ) Menos de 12 aos.
2.23 En el estudio de las huellas digitales, una importante caracterstica
cuantitativa es el nmero total de surcos para los 10 dedos de un
individuo.
Supngase que los nmeros totales de surco de los individuos en cierta
poblacin estn distribuidos aproximadamente en forma normal, con
una media de 140 y una desviacin estndar de 50. Hallar la
probabilidad de que un individuo elegido al azar de esta poblacin
tenga un nmero de surcos :
a.) De 200 o ms
b.) Menos que 100
c.) Entre 100 y 200
2.24 Si las capacidades de la cavidad craneana de ciertas poblacin estn
distribuidas aproximadamente en forma normal, con una media de
1400 c.c y una desviacin estndar de 125, encontrar la probabilidad
de que una persona elegida al azar de esta poblacin tenga una
capacidad de la cavidad craneana.
a.) Mayor que 1450 cc
b.) Menos que 1350 cc
c.) Entre 1300 y 1350 cc
60
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
2.25 Dada una poblacin normalmente distribuida con una media de 75 y
una varianza de 225, encontrar.
a.) P ( 50 X 100 )
b.) P ( X > 90 )
c.) P (X < 60 )
d.) P (X 85 )
e.) P ( 30 X 110)
2.26 La prdida de agua por transpiracin de una planta de maz en un da
caluroso es una variable aleatoria aproximadamente normal con
media 2,7 litros y varianza 0.64 litros
2
. Que porcentaje de planta de
maz pierden ms de 3.2 litros de agua por da caluroso.
2.27 Calcular la media, desviacin tpica, coeficiente de sesgo y coeficiente
de curtosis de una distribucin en la que P = 0.7 y N = 60, interpretar
los resultados.
2.28 Responda las preguntas siguientes:
a.) Qu son los ensayos de Bernoulli.
b.) Qu caractersticas determinan un fenmeno Binomial.
c. ) Qu caracterstica determina un fenmeno de poisson.
d,) Cmo se estandariza un variable aleatoria.
2.29 Un dado se lanza 180 veces. Hallar la media, desviacin tpica,
coeficiente de curtosis y coeficiente de sesgo del nmero de veces
que aparece el 4 en este experimento.
61
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
UNIDAD 3.0
DECISIN ESTADSTICA
Objetivo
De la unidad: Desarrollar la metodologa de prueba de hiptesis como una tcnica para
analizar diferencias y tomar decisiones; determinar los riesgos implicados al tomar tales
decisiones.

Contenidos:
3.0 Nociones sobre pruebas de hiptesis y mtodos no parametritos
3.1 Pruebas de Uno y Dos Extremos
3.2 Reglas de Decisin
3.3 Errores Estadsticos
3.4 Potencia de una Prueba
3.5 Procedimientos Estadsticos en la Investigacin
3.6 Diferencias entre las Pruebas Parmetricas y no Parmetricas
3.7 Prueba Binomial
3.8 Prueba de los Signos
3.9 Prueba de Cox y Stuart para Tendencia
3.10Prueba X
2
Para Diferencias en Probabilidades 2x2

3.11Prueba de Mc Nemar Para Cambios de Significancias
3.12Prueba de la Mediana
3.14Prueba de Bondad de Ajuste de Kolmogorov-Smirnov
3.15Prueba U de Mann-Whitney
3.16Prueba de Kruskal-Wallis
3.17Prueba de Sparman
Ejercicios
62
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.0 NOCIONES SOBRE PRUEBA DE HIPTESIS Y MTODOS NO
PARAMETRICOS
El trmino ms ampliamente usado en la estadstica moderna es la palabra
decisin; se usa tanto porque la teora estadstica y los mtodos
estadsticos toman una importancia, siempre en aumento, en la
confeccin y anlisis de los criterios en los cuales se basan las
decisiones.
No importa como decidamos los problemas que surgen en las ciencias
naturales, en la economa, en la vida cotidiana, etc. siempre hemos de
enfrentarnos, con el riesgo de escoger incorrectamente y sufrir las
consecuencias que encierra.
Considrense las siguientes cinco preguntas.
1. Qu porcentaje de los cupones impresos en un perodo se recupera?.
2. Es ms eficaz la receta A que la B?.
3. Es cierto que el 30% de las personas compra su marca favorita de
pasta para dientes sin importarle el precio de sta?.
4. Se encuentra este dado cargado a favor del 3?.
5. Los resultados que obtienen los hombres y las mujeres en la parte
verbal de la prueba SAT, son diferentes?.
Estas preguntas son de dos tipos. Las preguntas 1 y 2 piden una respuesta
numrica. Las ltimas tres requieren un respuesta del tipo si o no.
En muchas ocasiones, los estadsticos tratan este tipo de preguntas
mediante la formulacin de dos proposiciones opuestas que reciben el
nombre de hiptesis. Una hiptesis estadstica es una afirmacin a
cerca de una poblacin. Un experimentador intenta probar o
desmentir una afirmacin ms all de toda duda razonable mediante
un anlisis de la muestra obtenida de esa poblacin. Para las
preguntas 3, 4 y 5 pueden obtenerse los siguientes pares de
hiptesis.
3. Dentese con p = P(una persona compra su marca favorita de pasta
para dientes sin importar el precio de sta). Entonces las dos
hiptesis podran ser:
H
1
: El 30% de las personas compra su marca favorita sin importar el
precio, p =0.30
63
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
H
2
: El porcentaje de quienes son fieles a su marca es diferente del 30%,
p .30.
4. Sea p= P (en un tiro, el dado muestra un 3). Las dos hiptesis podran
ser:
H
1
: El dado es legal, p = 1/6.
H
2
: El dado est cargado en favor del 3, p > 1/6
Ntese que no se considera la posibilidad de que p sea menor de 1/6.
De manera estricta, H
1
y H
2
, en este ejemplo, no son exactamente opuestos.
Las hiptesis opuestas de H
2
:p>1/6 es H: p1/6, esto es p es menor o
igual a 1/6. Ocurre en muchas ocasiones que en un experimento real
no se consideran ciertas alternativas. en este caso, si una persona
comienza a sospechar al observar que el dado muestra muchos 3, el
mismo comportamiento indica que no existe ninguna razn para tratar
de establecer que se estn obteniendo muy pocos 3. Slo se desea
decidir si se obtienen o no ms nmeros 3 de los que se esperara
obtener con un dado legal.
5. Sea u
B
el promedio de los resultados obtenidos por los hombres, y u
G

el promedio de las mujeres. Las hiptesis podran ser:
H
1
: Los hombres y las mujeres obtienen los mismos resultados en la parte
verbal de la prueba SAT, esto es, u
B
= u
G
.
H
2
: Los hombres y las mujeres obtienen diferentes resultados en la parte
verbal de la prueba SAT, esto es, u
B
u
G
.
En general, los profesionales de la estadstica prueban la hiptesis que les
dice qu esperar al proporcionarle un valor especfico con qu
trabajar.
64
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ellos hacen llamar a esta hiptesis nula y la denotan por H
0.
La hiptesis nula
es la que presume franqueza y lealtad. Es la que ve al mundo a travs
de anteojos de color rosa. El dado es legal. La afirmacin que se
encuentra en este peridico es verdadera. Esta teora es correcta. La
hiptesis opuesta recibe el nombre de hiptesis alternativa y se
denota como H
1
: Sin embargo, la mayor parte de las veces esta
hiptesis no es de inters. Se sospecha que el dado est cargado,
que el peridico est en un error, que la teora est equivocada. En
muchas ocasiones, es esta sospecha la que incita a investigar, en
primer lugar, la pregunta. Algunos estadsticos se refieren a H
1
como
la hiptesis motivada.
65
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.1 PRUEBAS DE UNO Y DOS EXTREMOS
Si se sospecha que cierta hiptesis nula es falsa, pueden formularse tres
alternativas diferentes. Supngase que una persona lee en la revista
Pets que el 34% de las personas en Guatemala son propietarios de
ms de dos mascotas y se pregunta si en su localidad, Nort
Southtown, el porcentaje ser el mismo. Entonces, su hiptesis nula
deber ser que cifra de 34% es verdadera.
Sea P (un habitante de North Southtown es propietaria de ms de dos
mascotas). Entonces, H
0
es p =0.34.
La hiptesis alternativa podra ser cualquiera de las siguientes.
1. Si se piensa que p es mayor de 0.34 entonces H
1
: p>0.34
2. Si se sospecha que p es menor de 0.34, entonces H
1
: p<0.34.
3. si no se tiene ninguna idea de si el valor de p es ms grande o ms
pequeo de 0.34 entonces puede escribirse p 0.34.
En la primera alternativa slo se est interesado en aquellos valores de p
que sean ms grande que 0.34 y en la segunda en aquellos que sean
menores de 0.34. Estas se denominan pruebas de un extremo, ya
que los valores de inters se encuentran en cualquier direccin a partir
de 0.34. La tercera alterativa se conoce como prueba de dos
extremos, ya que los valores de inters se encuentran en cualquier
direccin a partir de 0.34.
Ntese que se han formulado las hiptesis de manera tal que el signo de
igualdad (=) siempre aparezca en la hiptesis nula, mientras que los
signos (<) y (>) aparecen en la hiptesis alternativa para pruebas de
un extremo.
La hiptesis alternativa para pruebas de dos extremos siempre contiene el
signo de no es igual ().La eleccin entre una prueba de uno o de dos
extremos se encuentra determinada por lo que el estadstico le
interese encontrar.
3.2 REGLAS DE DECISIN
66
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Al comienzo de un experimento deben formularse dos hiptesis que tienen la
caracterstica de ser opuestas entre s. Despus deber formularse
una proposicin con respecto a qu evidencia llevar a pensar que la
hiptesis alternativa es verdadera. Esta proposicin recibe el nombre
de regla de decisin. Cuando la evidencia apoya a la hiptesis
alternativa se dice que se rechaza la hiptesis nula. Cuando la
evidencia no apoya a la hiptesis alternativa, entonces se dice que no
es posible rechazar la hiptesis nula.
3.3 ERRORES ESTADSTICOS
Cuando se prueba una hiptesis nula, lo que se est tratando de decidir es si
sta es falsa o verdadera. Sin embargo, ya que la prueba estadstica
de hiptesis se basa en la informacin proporcionada por una muestra
y no es posible tener la seguridad completa de que la decisin sea
correcta, entones, en realidad, se encaran cuatro posibles situaciones.
3.3.1. H
0
es verdadera y la informacin proporcionada por la muestra
conduce a decidir que sta es verdadera.
3.3.2. H
0
es verdadera, pero la informacin proporcionada por la muestra
conduce a decidir, incorrectamente, que sta es falsa.
3.3.3. H
0
es falsa y la informacin proporcionada por la muestra conduce a
decidir, de manera correcta, que sta es falsa.
3.3.4. H
0
es falsa, pero la informacin proporcionada por la muestra conduce
a decidir, en forma errnea, que sta es verdadera.
En la primera y terceras situaciones, se ha tomado una decisin correcta.
En la segunda situacin se rechaza una hiptesis nula que es verdadera.
Esto se conoce como error de tipo I. En la ltima situacin no se rechaza
una hiptesis nula que es falsa. Los profesionales de la estadstica
llaman a eso error de tipo II. La tabla siguiente proporciona un
resumen de estos dos tipos de errores.
No se rechaza H
0
Se rechaza H
0
H
0
es verdadera Correcto Error de tipo I
67
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
H
0
es falsa Error de tipo II Correcto
Se utilizar la primera letra del alfabeto griego, alfa (), para presentar la
probabilidad de cometer un error de tipo I. De manera similar, beta
(), representar la probabilidad de cometer un error de tipo II.
3.4 POTENCIA DE UNA PRUEBA
Los estadsticos hacen referencia al valor de la expresin 1 - como la
potencia de una prueba. Esta es una medida de lo buena que es una
prueba para rechazar una hiptesis nula que es falsa. Mientras ms
poderosa sea una prueba, es decir mientras ms cercano a uno sea
el valor de 1 - ser mayor la probabilidad de rechazar una hiptesis
nula que sea falsa.
Una parte importante de la teora estadstica trata el problema de encontrar
una regla de decisin que haga que una prueba, de hiptesis sea lo
ms poderosa posible para cualquier valor dado de . El trabajo
terico original en esta rea fue desarrollado por J. Neyman y E. S.
Pearson, en la dcada 1930 - 1940.
3.5 PROCEDIMIENTOS ESTADSTICOS EN LA INVESTIGACIN
En el campo de la salud pblica slo mediante procedimientos estadsticos
podr conocerse la composicin y principales caractersticas de la
poblacin que se va a servir, los cambios que acontecen en ella, los
riesgos a que est sometida y las necesidades que presenta.
La planificacin de las actividades de la salud pblica, el control de los
programas que se estn desarrollando y la evaluacin final de su
rendimientos y eficiencia slo podr llevarse a cabo mediante
procedimientos estadsticos. En tal sentido la estadstica es tan
imprescindible para el trabajo de la salud pblica, como lo es la
contabilidad en las actividades del Comercio y la Industria.
El procedimiento que seguiremos en este trabajo comprende varios pasos;
las cuales ser aplicadas en su orden.
68
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.5.1 Formacin de la Hiptesis de Nulidad (Ho). Es una hiptesis de
diferencias nulas; es formulada por lo comn con la intencin expresa
de ser rechazada. Si se rechaza, puede aceptarse entonces la
hiptesis alterna (H1), la cul es la aseveracin operacional de
hiptesis de investigacin del ser experimentado.
3.5.2 Eleccin de una prueba estadstica (con su modelo estadstico
asociado) para probar Ho. De las pruebas capaces de usarse con un
diseo de investigacin dado, hay que escoger aquella cuyo modelo
se aproxima ms a las condiciones de la investigacin y cuyos
requisitos satisfacen las medidas usadas en la investigacin.
3.5.3 Especificacin del nivel de significancia ( ) y del tamao de la
muestra (N)
3.5.4 Encuentro (o suposicin) de la distribucin muestral de la prueba
estadstica conforme a Ho.
3.5.5 Sobre los resultados obtenidos hasta a hora se toma o se define la
regin de rechazo.
3.5.6 Calculamos el valor de la prueba estadstica con los datos obtenidos
de la (s) muestra (s). S el valor desciende a la regin de rechazo
Ho, debe rechazarse; si el valor cae fuera de la regin derechazo, Ho
no puede rechazarse al nivel de significacin escogido.
3.6 DIFERENCIA ENTRE LAS PRUEBAS PARAMTRICAS Y NO
PARAMTRICAS
Aunque en cada caso, el inters se enfoca en estimar o probar una
hiptesis; una prueba estadstica Paramtrica, es aquella cuyo modelo
especifica ciertas condiciones acerca de los parmetros de la
poblacin de la que se obtuvo la muestra investigada, que no se
prueba ordinariamente, sino se supone que se mantienen. La
significacin de los resultados de una prueba paramtrica depende la
validez de estas suposiciones. Las pruebas paramtricas tambin
requieren de los puntajes analizados sean productos de una medicin
que por lo menos tenga la fuerza de una escala de intervalo
69
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Una prueba estadstica no paramtricas es aquella cuyo modelo no
especifica las condiciones de los parmetros de la poblacin de la que
se saco la muestra. Hay algunas suposiciones que se asocian con la
mayoras de las pruebas estadsticas no paramtricas: observaciones
independientes y variables de continuidad bsica; pero estas
suposiciones son pocas y muchas ms dbiles que las asociada con
las pruebas paramtricas. Adems, las no paramtricas se aplican a
datos de una escala ordinal, y algunos a los de una escala nominal.
70
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.6.1 Ventajas de las Pruebas Estadsticas No Paramtricas
(i) Permiten la prueba de hiptesis que no son afirmaciones acerca de
valores de parmetros de poblacin.
(ii) Puede usarse pruebas no Paramtrica cuando se desconoce la forma
de la poblacin muestreada; aunque algunas pruebas no paramtricas
supongan identidad de forma de dos o ms distribuciones de
poblacin. En ciertos casos, las pruebas no paramtricas suponen que
la distribucin de base es continua, suposicin que comparten las
pruebas paramtricas.
(iii) S los tamaos de las muestras son tan pequeos como N=6, no hay
alternativa no paramtrica a menos que se conozcan exactamente la
naturaleza de la distribucin de la poblacin.
(iv) Hay pruebas estadsticas no paramtricas adicionadas para
observaciones hechas en poblaciones diferentes. Ninguna prueba
paramtrica puede manejar tales datos sin exigirnos suposiciones
aparentemente irreales.
( v) Las pruebas estadsticas no paramtricas son tiles tanto para datos
inherentes a los rangos como datos cuyos puntajes aparentemente
numricos tiene fuerza de rango.
( vi) Los mtodos no paramtricos son tiles para los datos simplemente
clasificatorios, medidos en una escala nominal y son estos mtodos
ms fciles en relacin con el clculo y como consecuencia, se
aplican con mayor rapidez que los procedimientos paramtricos.
3.6.2 Desventajas de las Pruebas Estadsticas No Paramtricas
(i) El uso de procedimientos no paramtricos con datos que pueden
manejarse con un procedimiento paramtricos conduce a un
desperdicio de datos.
(ii) Hasta el momento (al menos no conocemos) no hay mtodos no
paramtricos para probar las interacciones dentro del modelo de
anlisis de varianza.
(iii) La aplicacin de algunas de las pruebas no paramtricas puede ser
laboriosa para muestras grandes.
71
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.6.3 Cuando se deben usar las Estadsticas no Paramtricas?
Los procedimientos no paramtricos proporcionan alternativas tiles y en
muchas situaciones nicas, como las siguientes:
(i) Cuando la hiptesis que se va a verificar no incluye un parmetro de
poblacin.
(ii) Cuando los datos consisten en conteo o rangos de frecuencias, ms
bien que en medidas tales como: estatura, peso, puntajes de
pruebas etc.
( iii) Cuando no se hacen las suposiciones necesarias para la aplicacin
vlida de un procedimiento paramtrico.
(iv) Cuando se necesitan rpidamente los datos o informacin, que con el
uso de procedimientos paramtricos slo se conseguirn despus de
un perodo relativamente largo.
EL TAMAO DE LA MUESTRA. Muchas veces nos cuestionamos
acerca del tamao que debe tener una muestra y, sin embargo, es ste un
aspecto de gran importancia. Dado un nivel de confianza

,
denominamos error de estimacin, denotado por E a la mxima
diferencia que permitir, con nivel de confianza 100(1 -

) %, entre el
parmetro desconocido y el estadstico utilizado como estimador.
FORMULAS PARA CALCULAR EL TAMAO DE LA MUESTRA:
1.0 ERROR MAXIMO DE ESTIMACIN:
E
=
n

2

E
=
1
2

N
n N
n


Los valores de mayor uso para
2
son 1.645 para confiabilidad del 90%, 1.96 para
95% y 2.575 para una confiabilidad del 99%.
2.0 TAMAO DE LA MUESTRA
72
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
n =
E
Z 2
2
2
2

n =
( )

2 2
2
2
2
1
2
2
Z E
Z
N
N
+

3.0 ERROR MAXIMO PARA PROPORSIN: Cuando no se conoce p se toma
p= 0.50
E
=
( )
n
p p
Z
1
2


4.0 TAMAO DE LA MUESTRA PARA PROPORSIN:
n =
( )
E
p p
Z
2
1
2
2

n =
( )
( ) ( ) p p N
N
Z E
p p
Z
+

1 1
2
2
2
2
2
1

73
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
3.7. LA PRUEBA BINOMIAL
Es una de las pruebas que se encuentra con ms frecuencia en la estadstica
aplicada. La prueba se obtiene de un proceso conocido como Ensayo
de Bernoulli, en honor del matemtico suizo James Bernoulli (1.654
- 1.705), quien realizo importantes contribuciones en el campo de la
probabilidad. Cuando un slo ensayo de algn proceso o experimento
puede conducir slo a uno de dos resultados mutuamente exclusivos,
tales como muerto o vivo, enfermo o saludable, masculino o femenino,
el ensayo se conoce como ensayo de Bernoulli .
DATO: La prueba consiste del resultado de N ensayos independientes.
Cada resultado es uno u otro; clase 1 clase 2 pero no
ambas ; el nmero de observaciones en la clase 1 es n1 , y el
nmero de observaciones en la clase 2 es n2 = N - n1 ; por tanto N
= n1+n2.
SUPOSICIONES: Se fundamenta esta prueba en las siguientes suposiciones
(i) Cada una de las n observaciones se puede clasificar segn tenga
o no la caracterstica de inters.
(ii) Las n observaciones son mutuamente independientes
(iii) La probabilidad p de tener la caracterstica de inters permanece
constante en todo el procedimiento de muestreo.
HIPTESIS: Hay muchas situaciones en que un investigador desea verificar
la hiptesis nula de que, en alguna poblacin de inters, la proporcin
(porcentajes) de sujetos que tienen determinada caracterstica es igual
a algn valor p. Por ejemplo, un investigador en probar una hiptesis
nula relacionada con la proporcin de estudiantes del bachillerato que
fuman, o la proporcin de vctimas del cncer que sobreviven durante
cinco aos o ms, etc.
La hiptesis nula puede tener una hiptesis alterna bilateral o una de las dos
posibles hiptesis alterna unilaterales. Es decir, siendo po alguna
constante especifica 0 po 1:
(i) Prueba Bilateral o de Dos Colas
74
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ho : p = po
H1 : p po
(ii) Prueba Unilateral o de Una Cola.
Ho : p po
H1 : p > po
(iii) Prueba Unilateral o de Una Cola
Ho : p po
H1 : p < po
PRUEBA ESTADSTICA
Un experimento de Bernoulli puede resultar en un xito con una
probabilidad p y en un fracaso con una probabilidad q = 1 - p .
Entonces la prueba tendr una distribucin de probabilidades de la
variable aleatoria ( V.a ) binomial X, el nmero de xito en n
experimentos independientes, es:
b ( x ; n , p ) = n Cx. px . q

n - x
, con X = 0,1,2,....n
La medida ( ) y la varianza ( ) de la prueba binomial b( x ; n , p ) estn
dadas por :
= np y = npq
Estamos interesados en la probabilidad del resultado de la clase 1.
Permitiremos que la prueba estadstica T sea el nmero de veces del
resultado es clase 1 ; esto es : T = n1
REGLA DE DECISIN: Dependiendo en que hiptesis sea probada i , ii, iii las
reglas de decisin son diferentes :
75
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(i) Prueba de Dos Colas: La regin crtica de tamao corresponde
a las 2 colas de la prueba binomial con parmetros Po y N donde el
tamao de la cola superior es de 1 y el tamao de la cola inferior es
2 y 1 + 2 = . Esto es en la tabla binomial para el valor
particular de Po y N encontramos el nmero t1 tal que p ( y < t1 ) =
1 y encontramos el nmero t2 tal que p ( y > t2 ) = 2 o su
equivalente p ( y t2 ) = 1 - 2. Donde y es una variable aleatoria
binomial con parmetros Po y N.
76
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

Regin aceptacin
Regin rechazo Regin rechazo
t1 y t2
Los valores de 1 y 2 pueden ser aproximadamente iguales el uno al
otro. Entonces rechazamos Ho si T excede a t2 ( T > t2 ) o si T
es menor o igual a t1 ( T t1 ), en caso contrario aceptamos Ho.
(ii) Prueba de Una sola Cola : Ya que para valores grandes de T
indicaremos que es falso, la regin critica de tamaos consiste
para todos los valores de T Mayores que t donde t es el nmero
obtenido de la tabla binomial , usando po y N tales que p ( y > t )
= o su equivalente p ( y t ) = 1- donde Y tiene
distribucin binomial con
parmetros Po y N Rechazamos Ho si T > t ; aceptamos Ho si T t.
Regin rechazo

t
(iiii) Prueba de Una sola Cola : En este caso para pequeos valores de
T indican que Ho es falso, la regin crtica de tamao consiste
para todos valor de T t donde t es obtenida de la tabla binomial
usando Po y N a si que :
p ( y t ) =
donde Y tiene una distribucin binomial con parmetros Po y N.
rechazamos Ho si T t , en otro caso aceptamos Ho
77
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Regin rechazo

t

PROCEDIMIENTOS: Brevemente, estos son los pasos para el uso de la
prueba binomial:
(i) Se determina N, el nmero total de casos observados
preferiblemente (N 25).
(ii) Se determina las frecuencias de ocurrencia observando en cada una
de las dos categoras o clases
(iii) Se escoge el mtodo para encontrar la probabilidad de ocurrencia
conforme a Ho de los valores observados, o valores an ms
extremos.
EJEMPLO ILUSTRATIVO.

Por registro tomado por el S.S.S. (Servicio Seccional de Salud del Choc)
en el programa E.T.V. de epidemiologa se sabe que en Quibd
existieron en 1.995, 21267 casos censados con 91.584 habitantes de
los cules se toma una muestra de sangre a 10.957 habitante.
Saliendo Positivo (Malaria) 2.648 casas y 8.309 habitantes Negativos.
Si denotamos los Positivos como clase 1 entonces Po= 0.24 ; puesto
que Po = 2.648/10.957 = 0.24= 24%.
HIPTESIS
Ho : Po = 0.24
Hi : Po 0.24
Como n = 8.309 +2.648 la regin crtica de tamao = 0.05
aproximadamente puede obtener usando la aproximacin para
muestra grande al final de la tabla, as la regin crtica corresponde
para todos los valores T t1 , donde t1 = nPo + W 0.025
npo po ( ) 1 con = 0.05 , entonces / 2 = 0.025; W0.025 = t
1.96
78
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
t1= ( 10.957) (0.24) + ( - 1.96 ) 10957 0 24 0 76 ( . )( . ) = 2542
t2 = ( 10.957) (0.24) + 1.96 10957 0 24 076 ( . )( . ) = 2717
El valor de T obtenido es 2648 en este experimento por lo tanto la Ho es
aceptada dado que t1 < T < t2.
3.8 LA PRUEBA DE LOS SIGNOS.
La prueba de los signos es justamente la prueba binomial con
Po = .

El uso de esta prueba se remonta a 1.710 y por lo tanto tal vez es el mtodo
ms antiguo.
Es una de las pruebas no paramtricas mas sencillas de utilizar, su nombre
proviene del hecho de que se basa en la direccin (o signos de ms y
menos) de un par de observaciones y no en su magnitud numrica.
Es particularmente til cuando la medicin cuantitativa es imposible o no es
prctica, pudiendo an haber cierto orden entre los miembros de cada
pareja, es usada esta prueba para dos poblaciones que tienen la
misma mediana, puede ser utilizada tambin para tendencia en una
serie de medidas ordinales o como una prueba para correlacin.
DATOS : Consiste del resultado de observar una muestra aleatoria
bidimensional, ( x1, y1 ) , ( x2 , y2 ) , ........ , ( xi , yi ) , .......... ( xn , yn
) , en donde hay n pares de observaciones.
Dentro de cada par ( xi , yi ) una composicin es hecha y la pareja es
clasificada como + ( ms) o - ( menos ).
S xi > yi la diferencia se denota con un +
S xi < yi la diferencia ser denotado con un - .
S xi = yi eliminar el par de las muestras y se reduce el tamao de la
misma.
SUPOSICIONES: Tal vez la aplicacin ms frecuente de la prueba de los
signos es la verificacin de la hiptesis nula de que la diferencia de
las medidas es 0 (cero).
79
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Supongamos que designamos un conjunto de puntajes con X y otros
conjuntos de puntajes comprendidos en la poblacin relacionando
con Y
Las muestras de tamao N de cada conjuntos de puntajes producir pares
de observaciones , que se pueden designar : ( X1 , X2 ) , ( X2 ,
y2 ) , ...( Xi , yi ) , ........... ( Xn, yn ) :
(i) Las variables aleatorias bidimensionales ( Xi , yi ), i = 1,2,....,n son
mutuamente independiente .
(ii) La escala de medida es por la mayor ordinal dentro de cada par. Esto
es cada pareja ( Xi , yi ), puede determinar un + ( ms) , un -
( menos ) o en pares .
(iii) Las parejas ( Xi , Yi ) son internamente consistentes en que s
P ( +) > P ( - ) para una pareja ( Xi , Yi ) entonces P ( + ) > P ( -1 )
para todas las parejas; lo mismo sucede para P ( +) < P ( - ) y P ( +)
= P ( -).
HIPTESIS:
(i) Prueba Bilateral
Ho : P ( Xi < Yi ) = P ( Xi > Y1 ) i
Hi : P ( Xi < Yi ) < P ( Xi > Yi ) i
P ( Xi < Yi ) > P ( Xi > Yi ) i
(ii) Prueba Unilateral
Ho : P ( Xi < Yi ) P ( Xi > Yi ) i
Hi : P ( Xi < Yi ) > P ( Xi > Yi ) i
(iii) Prueba Unilateral
Ho : P ( Xi < Yi ) P ( Xi > Y1 ) i
Hi : P ( Xi < Yi ) < P ( Xi > Yi ) i
Es de anotar que la prueba de los signos es insesgada y consistente cuando
se prueba las hiptesis de arriba.
80
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La prueba es usada tambin para probar la siguiente contraparte en cuyo
caso no es insesgada ni consistente.
(i) Prueba Bilateral: interpretamos la hiptesis nula como Xi y Yi ,
tomando el mismo parmetro :
Ho : E ( Xi) = E ( Yi) i
Hi : E ( Xi) E ( Yi) i
Similarmente puede hacerse la prueba para la mediana ( med)
Ho : Med ( Xi) = Med ( Yi) i
Hi : Med (Xi) Med ( Yi) i
(ii) Prueba Unilateral: La hiptesis nula puede ser considerada para
indicar que los valores de Xi tienden hacer mayores que los valores de
yi viceversa. Por lo tanto:
Ho : E ( Xi ) E ( Yi ) i
Hi : E ( Xi) < E ( Yi) i
(ii) Prueba Unilateral:
Ho : E ( Xi ) E ( Yi ) i
Hi : E ( Xi) > E ( Yi) i
PRUEBA ESTADSTICA
La estadstica para esta prueba denotada por T , es el nmero de signos
ms ( +) entre las N pares . Dado que bajo Ho cada par
constituye un
ensayo independiente con una probabilidad para el signo + de 0.5 , la
estadstica T tiene una distribucin binomial con P = 0.5 .
T : N de parejas ( Xi , Yi ) en la cul Xi > Yi
T : N de +
REGLA DE DECISIN
81
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Es prioritario que se elimine todas las parejas empatadas y se tome a N
como todas las parejas no empatadas , es decir , N = N total de
+ y -
Representar el nivel de significancia aproximado.
La regla de decisiones siguiente depende de la hiptesis a probar.
( i) Bilateral : Para N 20 se usa la Tabla Binomial con el valor
aproximado para N y con P = 0.5 . Seleccionando en la tabla un valor
al rededor de / 2 y lo llamaremos 1. El valor de Y corresponde a
1 es
llamado t. La regin crtica de tamao 2 corresponde al valor de T t
o T n - t .
Rechazamos Ho si T t o si T n - t al nivel de significancia 21 en
otro caso aceptamos Ho.
Para n > 20 se usar la aproximacin:
t = ( n + W /2 n )
Donde W /2 es obtenida de la tabla si = 0.05 entonces W /2 =
(- 1.996) y la anterior ecuacin seria aproximadamente t = n/2 - n
(ii) Unilateral : Para grandes valores de T indica que un ms + es
probable que un menos - como dice H1 ; as la regin crtica
correspondiente a valores de T n-t, donde t es hallado por medio de
la tabla con P = 0.5 y n , y es aproximadamente igual a 1 . El
valor correspondiente a 1 es t. Para n > 20 puede
encontrarse por la aproximacin
t = ( n + W n ).
Ho es rechazado al nivel de significancia 1 ( o si el valor en la tabla es
exacto ) si T n - t .
82
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(iii) Unilateral : Para pequeos valores de T indica que un menos -
es ms probable que un mas + en conformidad con H1 ; por tanto
t es encontrada exactamente como en (y). La regin crtica de
tamao 1 ( o ) correspondiente al valor de T t rechazamos Ho
si T t al nivel de significancia 1 ( o en el caso de n 20)
PROCEDIMIENTOS
Para el empleo de esta prueba se usa estos pasos.
(i ) Examine cada una de las parejas ( Xi , Yi )
(ii) Si Xi > Yi asigne el signo mas , si Xi < Yi, asigne el signo menor; si
Xi = Yi descarte la pareja.
(iii) Represente con n el nmero de parejas no descartadas.
(iv) Para probar la hiptesis de no diferencia entre los efectos de algn
tratamientos, compare el nmero de veces que se presenta el signo
menos frecuente (valor observado) con los valores crticos tabulados.
(v) Si el valor observado es igual o menor que el valor tabulado para el nivel
de significancia escogido, la hiptesis se rechaza; de otra manera no
se rechaza.
EJEMPLO ILUSTRATIVO 1.
El SSS del Choc en el programa de malaria trata de decidir si utiliza el
rociado contra el zancudo (Anofele) en ciertos barrios de la Ciudad
de Quibd en orden prioritario. (Barrios perifricos y del casco
urbano).
Se tomaron muestras de 1.000 casas y as detectar el nmero de afectados
de Paludismo (Falsiparum y Vivas). Para la cual se presentan la
siguiente estadstica.
TABLA QUE MUESTRA LAS PERSONAS AFECTADAS POR PALUDISMO
83
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
BARRIOS CASA
CASO
POSITI
VO
CASO
NEGAT
IVO
FALSIPARUM VIVAS
1 200 36 164 20 16
2 150 25 125 11 14
3 100 8 92 4 4
4 80 5 75 3 2
5 70 2 68 2 0
6 70 7 63 1 6
7 120 16 104 4 12
8 50 4 46 2 2
9 60 7 53 4 3
10 60 12 48 7 5
11 25 5 20 3 2
12 15 3 12 2 1
84
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1000 130 870 63 67
85
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
De la tabla anterior se puede inferir al nivel de significancia de 0.05 que las
personas afectadas de malaria Falsifarum son afectadas
mayormente de salubridad, que los afectados de Vivas ?
SOLUCIN: Si Po , P representa las personas afectadas por Fasiparum y
Vivas respectivamente entonces.
Ho : Po = P
H1 : Po > P
: 0.05
ESTADSTICO DE PRUEBAS
Variable Binomial con P= 1/2.
Tablas que relacionan personas afectadas de malaria ( Falsiparum y Vivas )
86
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ESTIMACION DE CONOCIMIENTOS DE PERSONAS
AFECTADAS POR LA MALARIA (FALSIPARUM-
VIVAS)
DIRECCION SIGNOS
Barrios Pares Falsiparum Vivas
1
( F1, V1) 20 16 XF1 > XV1 +
2
(F2 , V2) 11 14 XF2 < XV2 -
3
(F3 , V3 ) 4 4 XF3 = XV3 0
4
(F4 , V4) 3 2 XF4 >XV4 +
5
(F5 ,V5) 2 0 XF5 > XV5 +
6
(F6 , V6) 1 6 XF6 < XV6 -
7
(F7 ,V7) 4 12 XF7 < XV7 -
8
( F8 , V8) 2 2 XF8 = XV8 0
9
( F9 , V9) 4 3 XF9 > XV9 +
10
(F10 , V10) 7 5 XF10 >XV10 +
11
(F11 , V11) 3 2 XF11 > XV11 +
87
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
12
( F12, V12) 2 1 XF12 > XV12 +
88
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Despus de establecer cada Fxi > Vyi con un smbolo + y cada Fxi <
Vyi con un - y descartar cuando Fxi = Vyi = 0 en la tabla anterior
entonces se tiene que n = 10 y X = 7 utilizando la aproximacin de la
curva normal se encuentra:
6.5 - 5 3. 3
Z = --------------- = ---------- = --------------- = 0.9486833 0.95

10
/ 2
10
3.1622776
Entonces P = P ( X 7 ) P ( Z > 0.95 )
= 1 - P ( Z < 0.95)
= 1 - 0.8289
= 0.1711
Luego no se rechaza Ho y se concluye que las personas afectadas de
malarias falsiparum son mayormente afectadas en salubridad.
EJEMPLO ILUSTRATIVO 2.
El cuadro siguiente relaciona 20 educadores que se toman la tensin arterial
(Teniendo en cuenta el sstole) . En la Caja de Previsin Social del
Magisterio del Choc.
En el programa de Hipertensin. A intervalo de 4 das de por medio para el
mismo paciente;

Utilizar la prueba de los signos para probar, al nivel de significancia de 0.05,
la hiptesis nula de que los educadores asistentes al programa de
hipertensin no se estn haciendo adecuadamente el tratamiento por
lo tanto la presin arterial (sstoles) no se les normaliza.
S
o ,
representa los educadores que se le tomo la presin arterial el 1
da y 4 da respectivamente estamos :
Ho :
o ,

Hi :
o
>


89
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
= 0.05.
ESTADSTICO DE PRUEBA
Variable binomial X con = tabla de 20 educadores que se tomaron las
tensiones arterial (sstoles) a intervalo de 4 das en la Caja de
Previsin Social del Magisterio del Choc.
90
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
TABLA QUE MUESTRA 20 EDUCADORES QUE SE TOMARON LAS TENSIONES EN LA
CAJA DE PREVISION SOCIAL MAGISTERIO DEL CHOCO
91
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EDUCADORES 1 DIA 4 DIA DIREC/ DE LA
DIFERENCIA
SIGNOS
1 140 150 (A1i,A4i) i=1,2-,...
2 140 140 A11=A41 -
3 150 160 A12 = A42 0
4 120 110 A13 < A43 -
5 130 120 A14 >A44 +
6 140 120 A15 > A45 +
7 160 170 A16 > A46 -
8 130 140 A17 < A47 -
9 160 130 A18<A49 +
10 120 120 A110= A410 0
11 140 140 A0111 = A411 0
12 150 120 A112>A412 +
13 120 130 A113<A413 -
14 140 130 A114>A414 +
15 120 140 A115<A415 -
16 150 150 A116=A416 0
17 130 120 A117> A417 +
18 120 140 A118< A418 -
19 140 130 A119>A419 +
20 150 140 A120>A420 +
92
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Despus de identificar el proceso de la direccin de la diferencia para
establecer los signos, se tiene que:
8.5-8 (0.5)(2)
n = 16 , X = 9 entonces Z = --------------- = ---------------- = 1/4= 0.25 luego
,
16
/2 4
P = P ( x 9 ) P ( z > 0.25) = 1- P ( z > 0.25) = 1-0.5987 = 0.4013.
Esto implica que P = 0.4013 luego se acepta Ho , puesto 0.4013 > 0.05
luego los educadores asistente al programa de hipertensin no se
hace adecuadamente el tratamiento por tanto la presin arterial
( sstole) no se les normaliza.
3.9 PRUEBA DE COX Y STUART PARA TENDENCIA
DATOS: El dato consiste de observaciones en una sucesin de M.a X1 , X2.,
........, Xn arregladas en un orden particular en tal orden las muestras
aleatorias son observadas . Se desea ver si existe una tendencia en
la sucesin. Se agrupan las M.a en parejas ( X1 , X1 + c ) , ( X2 , X2
+ c) , ....... ( Xn 1-c , Xn ) donde c = n/2 si n es par , y c= n +
si n es impar ( la mitad de la M.a es eliminada se reemplaza cada
pareja ( Xi , Xi + c) con un + si Xi < Xi + c o un - si Xi > Xi
+c. Eliminando los empates el nmero de parejas restantes es
llamado N.
SUPOSICIONES:
( i) Las variables aleatorias X1 , .........,Xn son muestrealmente
independiente .
(ii) La escala de medida de las Xi es al menos ordinal
(iii) Las Xi estn idnticamente distribuidas, o hay una tendencia esto es las
variables posteriores son ms probables de ser >, ms que < y
viceversa.
HIPTESIS:
93
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(i) Bilateral:
Ho : p ( xi < xi +c ) = p ( xi > xi + c ) i
H1 : p ( xi < xi +c ) p ( xi > xi + c ) i
( ii) Unilateral:
Ho : p ( xi < xi + c ) p ( xi > xi+c ) i
Hi : p ( xi < xi + c ) > p ( xi > xi+c ) i
( iv) Unilateral:
Ho : p ( xi < xi +c ) p( xi > xi + c ) i
Hi : p ( xi < xi +c ) < p( xi > xi + c ) i
La usual interpretacin dada en las hiptesis anteriores es la
siguiente.
(i) Ho : No existen tendencia
H1 : Hay una tendencia hacia arriba o hacia abajo
(ii) Ho : No hay tendencia hacia arriba .
H1 : Hay tendencia hacia arriba
(iii) Ho : No hay tendencia hacia abajo
H1 : Hay tendencia hacia abajo
PRUEBA ESTADSTICA:
Como en la prueba de los signos T = N de parejas + (las parejas donde
Xi + c > Xc ).
REGLA DE DECISIN
Es exactamente la de la prueba de los signos.
EJEMPLO ILUSTRATIVO
La razn promedio de diarrea aguda segn el grupo de edad en los
pacientes a consulta medica de acuerdo a los datos estadsticos de
(morbilidad por consulta medica de urgencia del hospital San
Francisco de Ass de Quibd), es anotada cada mes por un periodo de
dos aos, la hiptesis:
94
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ho la razn de diarrea aguda en el servicio de urgencia del hospital San
Francisco de Ass de la ciudad de Quibd no es decreciente.
H1 : La razn de diarrea aguda en el servicio de urgencia del Hospital San
Francisco de Ass de la cuidad de Quibd es decreciente.
La razn de diarrea aguda es conocida siguiendo un ciclo anual y de acuerdo
a un grupo de edad.
95
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
TABLA QUE NOS MUESTRA LOS NIOS AFECTADOS POR DIARREA
96
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
1993 1994
Menor de 1 ao 451 517 +
1 4 aos 459 522 +
5 14 aos 132 170 +
15 44 aos 229 276 +
45 59 aos 59 53
60 y ms aos 59 81+
97
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Xi yi
98
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
T = Nmero de pareja donde el ao /94 tiene un alto nmero de pacientes
con diarrea aguda con relacin a /93 (yi>Xi), lo cual es de 5 en
este ejemplo.
Debido que la prueba es detectar una tendencia hacia arriba, la regin crtica
de tamao 0.0730 corresponde a todos los valores T 3, ver tabla
con n = 6 y P = . Por consiguiente Ho es aceptada. El nivel critico
es dado por
= P ( T 5 / Ho es V ) = 0.387.
3.10. PRUEBA X PARA DIFERENCIAS EN PROBABILIDADES 2x2.
DATO: Cuando los datos de investigacin consisten en frecuencias de
categoras discretas, pueden usarse la prueba X para determinar la
significacin de las diferencias entre dos grupos independientes. La
medicin implicada puede ser tan vaga como escala nominal.
Los conceptos y tcnicas en que se basa esta prueba fueron presentada en
1.900 por Karl Pearson (1857-1936), quin ha sido llamado el
fundador de la ciencia estadstica.
Un investigador puede estar interesado en saber, respecto de una
poblacin, si dos criterios de clasificacin estn probablemente
relacionados no .
Una muestra aleatoria de Na observacin es sacada de una poblacin ( o
antes de aplicado el tratamiento) y cada observacin es
clasificada en las clases 1 o 2 el N total en las dos clases estn
dada por a1 y a2 respectivamente en donde a1 + a2 = Na.
Una Nb observacin es sacada de una segunda poblacin ( o la primera
poblacin despus de haber aplicado algn tratamiento), y N total
de observaciones en la clase 1 es b1 y nmero total de la clase es
b2 entonces b1 + b2 = Nb .
Los datos se arreglan en una tabla de contingencias 2x2.
99
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
CLASE 1 CLASE 2 TOTAL
Tratamiento
1
Poblacin
1

A A1 a2 Na
Tratamiento
2
Poblacin
2
B B1 b2 Nb
100
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

TOTALES N1 N2

N
101
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
El nmero total de observacin es N.
SUPOSICIONES
1. Cada muestra es una muestra aleatoria
2. Las dos muestras son muestralmente independientes.
3. Cada observacin puede ser categrizada en la clase 1 o 2
HIPTESIS: La probabilidad que un elemento sea seleccionado
aleatoriamente estar en la clase 2 y ser denotada por p1 en la
poblacin 1 y p2 en la poblacin 2.
(I).- Prueba Bilateral
Ho : p1 = p2
H1: p1 p2
(ii) Prueba Unilateral
Ho : p1 p2
H1 : p1 > p2
No es necesario que p1 y p2 sean conocidos
PRUEBAS ESTADSTICAS
N (a1 b2 - a2 b1) N( a1b2 - a2b1)
T = ---------------------------------------------------------- = ----------------------------
(a1 + b1) (a2 + b2) (a1 + a2) (b1 + b2) N1 N2 Na Nb
En 1.934, Yates propuso el empleo de lo que se ha venido a llamar
correccin de Yates para continuidad, cuando se esta calculando X
, con base en una tabla de contingencia 2x2. El propsito de la
correccin es mejorar la aproximacin de la distribucin X a
la X . La correccin consiste en restar 0.5 n del valor absoluto de
a1b2 - a2b1 en el numerador de la ecuacin.
102
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
N (|a1b2 - a2b1| - N)
Es decir X (corregida) = ----------------------------------------.
N1 N2 Na Nb
REGLA DE DECISIN:
La exacta distribucin de T es difcil de tabular por que todas las diferentes
combinaciones de a1 , a2 , b1 y b2, por lo tanto la gran aproximacin
es usada para la T , la cual es X (1).
(y) Prueba Bilateral: Rechazar Ho a un nivel aproximado s T > X1 - ,
el cuantl ( 1 - ) de una X (1) .

(ii) Unilateral: Calcular las proporciones de las muestras en clase 1, a1/
NA, y b1 / NB. Si a1/ NA b1 / NB, en acuerdo con Ho se acepta
Ho inmediatamente. Si a1 / NA > b1 / NB, entonces calculamos T ,
y rechazamos Ho a un nivel aproximado de / 2, si T > X1 - ,
el cuantl ( 1 - ) de una X (1) .
PROCEDIMIENTO
Estos son los pasos para usar la prueba X para dos muestras
Independientes:
(i). Se calcula las frecuencias observada en una tabla de contingencia k x r
usando las columnas de k para los grupos y las filas de r para las
condiciones. As, aqu k = 2.
(ii). Se determina la frecuencia esperada para cada una de las celdillas para
obtener el producto de los totales Marginales comunes a ella y
dividirlo por (N es la suma de cada grupo de totales Marginales.
Representa el nmero total de observaciones independientes. Las N
Infladas invalidan la prueba) .
El paso 2 es necesario cuando los datos estn en una tabla de 2x2, lo que
permiten el uso de la frmula X (corregida).
103
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(iii) Para una tabla 2x2, se calcula X en la formula X (corregida).
Cuando r > 2, se calcula X con la formula X (no corregida).
(iv). Se determina la significacin de la X observada consultando la
tabla para una prueba de una cola, se divide por dos el nivel de
significacin sealado.
Si la probabilidad dada por la tabla es igual o menor que , se rechaza
Ho y se acepta H1
EJEMPLO ILUSTRATIVO
Dos enfermedades sacadas del cuadro estadstico del ISS (Causas de
demanda en consulta mdica por grupos de edad, resumen mensual),
son muestreados aleatoriamente.
Para determinar si la proporcin del grupo de 45 y ms aos afectada es
diferente para la dos enfermedades. De la primera enfermedad
(I.R.A) 424 de 1476 pacientes fueron afectadas, de la segunda
enfermedad ( H.T.A) 1.216 de los 1.404 son consideradas
afectados .
AFECTADAS NO AFECTADAS
ENFERMEDAD N 1. 424 1.052 1.476
ENFERMEDAD N 2 1.216 188 1.404
1.640 1.240 2.880
104
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Las suposiciones son conocidas y una prueba bilateral es usada.
Ho: la proporcin afectada son iguales
N ( a1 + b
2
- a
2
+ b
2
)
2
T -------------------------------
n
1
n
2
( a
1
+ a
2
) (b
1
+ b
2
)
2880 [(424) (188) - (1052) (1216) ]
2
T -------------------------------------------------------
1476(1404) (1640) (1240)
2880 [ 79712 - 1279232 ]
2

T -----------------------------------------
( 1476) (1040) (1640) (1240)

2880 [ - 1199520 ]
2
T ----------------------------------------- 983.30
(1476) (1404) (1640) (1240)
T 983.30
El cuantl 0.95 de X
2
(1) ,
es 3.841 por lo tanto la regin crtica de tamao
aproximadamente es 0.05 que corresponde a valores de T > 3.841,
as Ho es aceptable.
3.11. PRUEBA DE Mc NEMAR PARA CAMBIOS DE SIGNIFICANCIA
Esta prueba es particularmente apropiada para los diseos de antes y
despus en las que cada persona es usada como su propio control,
en la medida tiene la fuerza de escala nominal y ordinal. As, podra
usarse para probar la efectividad de un tratamiento particular.
DATO : El dato consiste de observaciones en n v.a bidimensionales
(xi, yi); i = 1,....., n . La escala de medida para Xi e yi es normal con 2
categoras , las cuales pueden ser 0 y 1 , esto es , los
valores posibles de ( xi , yi ) son ( 0,0) , ( 0,1) ; ( 1,0) y ( 1,1 ) .
En la prueba de MCNEMAR los datos son usualmente resumidos en una
tabla de contingencias 2 x 2 como sigue:
105
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Xi = 0
a ( nmeros parejas donde
Xi= 0 y yi = 0
b ( No de parejas donde Xi=0
y yi=1
Xi = 31
c ( nmero de parejas donde
Xi = 1 y yi = 0
d ( # de parejas donde Xi=1
y yi=1)
SUPOSICIONES
(i) Las parejas ( xi , yi ) son mutuamente independientes
(ii) La escala de medida es nominal con 2 categoras xi , yi .
(iii) La diferencia p( xi=0 , yi=1) - p( xi=1 , yi=0) es negativa i o
positiva i.
HIPTESIS
Ho : p( xi=0, yi=1) = p( xi=1, yi=0) i
H1 : p( xi=0, yi=1) p( xi=1, yi=0) i

Esta hiptesis puede tomar una ligera forma diferente si agregamos
p( xi=0, yi=0 ) a ambos lados de la ecuacin en
Ho : p( xi=0, yi=1) + p( xi=0, yi=0) = p( xi=1, yi=0) + p( xi=0, yi=0)
106
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
El lado izquierdo de Ho incluye todas las posibilidades para yi , y aqu es
igual p( xi = 0) similarmente, la parte derecha incluye todas las
posibilidades para xi , y as igual p( yi=0) por consiguiente
tenemos un nuevo conjunto de hiptesis en la forma :
Ho : p( xi=0) = p( yi=0) i
H1 : p( xi=0) p( yi=0) i
Claro est, que es equivalente a:
Ho : p( xi = 1 ) = p ( yi = 1)
H1 : p( xi = 1) p ( yi =1 )
PRUEBA ESTADSTICA
La prueba estadstica para esta prueba de NCNEMAR es usualmente
escrita as:
(b - c)
T1= --------------
b + c
Sin embargo para b + c 20 se prefiere T2 = b.
Ntese que Ni T1 ni T2 depende de a o d , esto debido a que a
y d representa el nmero de empates , y estos son descartados
en el anlisis .
REGLA DE DECISIN
Sea n = b + c. Si n 20 usar la tabla. Si es el nivel de
significancia deseada ver la tabla con n = b + c y p =
encontrar en la tabla el /2 aproximado llamado este 1 y el
valor correspondiente y es llamado t .
Rechazar Ho si T2 t o si T2 n - t al nivel de significancia de
21.
107
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
En otro caso aceptar Ho si n > 20 use T1 y la tabla.
Rechazar Ho al nivel de significancia si T1 > 1- en donde 1-
es el Cuantl de X ( 1 ) en otro caso acepar Ho .
PROCEDIMIENTO

( i) Se ordena las parejas en un tabla de contingencias 2 x 2 .
(ii) Se determina las frecuencias esperadas en las celdillas a y d.
(iii) Se determina la probabilidad conforme a Ho asociada con un valor
tan grande como el valor observado de la X en la tabla.
108
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO ILUSTRATIVO.
Durante los meses de Abril - Julio del ao 1996 se entrevistaron a 100
personas (M.a) que llegaron al Hospital San francisco de Ass de la
Ciudad de Quibd a utilizar el servicio.
Dichas entrevista fueron realizadas antes que las personas utilizarn los
servicios y despus de haberlo utilizado.
El objeto de la entrevista fue la calidad de los servicios hospitalarios de dicha
entidad. Cuya respuesta fueron calificada como buena calidad o mala
calidad.
64 personas manifestaron mala calidad antes de utilizar el servicio. Y 36
manifestaron buena calidad.
Despus de utilizar los servicios las mismas personas expresaron su opinin
de nuevo.
Aquellas personas que anteriormente manifestaron mala calidad
exactamente 0.125 % cambiaron su opinin.
Las personas que anteriormente manifestaron buena calidad 0.25%
exactamente cambiaron su opinin.
Los resultados arrojados por la entrevista fueron ubicado en la siguiente
tabla.
DESPUES
109
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
BUENA CALIDAD MALA CALIDAD
A
N
T
E
S
a
56
b

8


64
c
27
d
9 36
110
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
100
SOLUCIN: Se establecieron las siguientes hiptesis
Ho: A los entrevistados les interesan la entrevista preocupndole los
resultados que pueda esta arrojar por el problema de la buena o mala
calidad del servicio.
H1: Se establece un cambio en porcentajes en todos los entrevistados
quienes manifiestan mala calidad. Considerar los Xi en ( Xi , Yi ) =
0 , si la i-sima persona manifiesta mala calidad antes , , 1 si las
personas que manifiestan buena calidad antes.
Anlogamente yi identifica a la i-sima persona despus de la entrevista.
La estadstica es:
( b - c ) (8 -27 ) ( - 19 ) 361
T = ---------------- = ---------------- = ---------------- = ---------- = 10.34
b + c 8 + 27 35 35
Entonces T1 = 10,34
La regin crtica de tamao = 0.05 corresponde a todas los valores
T1 > 3,84 , el cuantl 0.95 de X (1) de la tabla. Debido que 10, 34 >
3, 84
Entonces se rechaza la hiptesis nula y la inferencia que se hace es que los
entrevistados en su mayora estn interesados de la mala calidad de
los servicios hospitalarios.
3.12 LA PRUEBA DE LA MEDIANA.
Es uno de los mtodos no paramtricos ms simples.
La prueba de la mediana es un procedimiento para contrastar o probar si dos
o ms grupos (muestras) independientes (no necesariamente del
mismo tamao) provienen de poblaciones con igual mediana. Para
mayor simplicidad, se limitar aqu el estudio a dos muestras
solamente, pero el procedimiento se puede extender muy fcilmente a
tres o ms muestra.
111
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
DATOS : Para cada una de las K poblaciones se obtienen una muestra
aleatoria de tamao ni con i = 1,2,.... , K ; se determina la
mediana combinada de la muestra . Esto es el nmero el cual es
excedido por la mitad de las observaciones al ordenar N ( N = ni +
n2 + ....+ nK ) el valor de la muestra determinada. Esta es llamada la
Gran Mediana.
Sean a, b los nmeros de observaciones de la muestra que excede a la
gran mediana y c, d el nmero de observaciones que estn por
debajo de la gran mediana. Sean ni y n2 los nmeros de
observaciones en las dos muestras respectivamente; se obtienen una
tabla 2 x 2 como sigue:
112
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Nmeros de valores Grupo Grupo TOTAL
Por encima de la media a b a+b
Por debajo de la gran media c d c+d
113
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

TOTAL
a+c =n1 b+d = n2 n1 + n2 = n
114
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

SUPOSICIONES: Se basa esta prueba en las siguientes suposiciones:
(i) Las muestras son seleccionadas al azar (aleatoria), de sus poblaciones
respectivas.
(ii) Las poblaciones son de la misma forma, difiriendo slo en la
localizacin.
(iii) Las muestras son independientes cada una de las otras y no
necesariamente iguales.
(iv) La variable de inters es continua.
(v) La escala de medida es ordinal.
(vi) Si todas las poblaciones tienen la misma mediana , entonces todas las
poblaciones tiene la misma probabilidad de que una observacin
excede la gran mediana.
HIPTESIS: La hiptesis de nulidad Ho supone que todos las K
poblaciones tienen la misma mediana ; la hiptesis alterna Hi supone
que al menos una de las poblaciones tiene diferentes mediana
( Prueba de dos colas ) o que la mediana de una poblacin es ms
alta que la otra ( prueba de una cola ) .
PRUEBA ESTADSTICA:
Si la hiptesis Ho es cierta, esto es, si las dos poblaciones de donde sean
tomado las muestras tienen igual mediana, seria de esperar que la
mitad de los valores de cada muestra quedaran por encima y la mitad
por debajo de la gran mediana. Es decir que se esperara que: a =
c = 0.5 n1 y que b = d = 0.5 n2
Entonces, si n = n1 + n2 es mayor que 20 y cuando la frecuencia esperada
en cada casilla es por lo menos 5 , se puede utilizar X corregida
por continuidad. Si la ms pequea frecuencia esperada es menor
que 5, se usa la prueba de Fisher; cuando n1 + n2 es menor que 20,
se usa la prueba de Fisher.
En este caso usaremos:
115
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
n ( |ad - bc | - n/ 2 )
X =----------------------------------- = T
(a +b)( a+c) ( c+d)( b+d)
Que tienen un (1) grado de libertad
REGLA DE DECISIN.
La regin crtica aproximada de tamao corresponde a valores de T > X 1
- , ( 1 - ) es el cuantl de X ( k-1) si T > X 1 - rechazamos
Ho.
PROCEDIMIENTOS
Estos son los pasos para el uso de esta prueba:
(i) Se determina la mediana combinada (gran mediana) de los puntajes
n1 + n2
(ii) Se dividen en la mediana combinada los puntajes de cada grupo. Se
registra las frecuencias resultantes en una tabla 2x2
(iii) Se encuentra la probabilidad de los valores observados por la prueba
X (segn criterio).
(iv) Si la p resultante de la prueba es igual a o menor que , se
rechaza Ho.
EJEMPLOS ILUSTRATIVOS.
Cuatro diferentes enfermedades registrada en el ISS (teniendo en cuenta el
orden para cada enfermedad establecido en el anexo de causa de demanda
en consulta medica por grupos de edad fecha ao /95 mes, - V ) fueron
asignada aleatoriamente a un gran nmero de persona para cada mes se
estableci el nmero de individuo que padecan cada enfermedad.
116
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ENFERMEDADES E.D.A SINDROME FEBRIL ANEMIA AMIBIASIS
43 29 6 3
49 38 19 18
85 45 28 28
62 48 62 27
40 36 46 23
51 44 38 22
Con el propsito de determinar si hay una diferencia entre las enfermedades
como resultados de las causas de demanda en consulta mdica por
grupo de edad, se emplea la prueba de la mediana, debido a la
diferencia entre las medianas de la poblacin podra interpretar como
una diferencia en el valor del grupo de edad.
Ho : Todos los grupos de edad tiene la misma mediana en la causa de
demanda con consulta mdica .
Hi : Por lo menos dos de los grupos de edades difieren con respuesta a la
mediana en la causa de demanda en consulta mdica.
Un conteo revela que existe 24 observaciones, as el promedio de la 12 ava y
la 13 ava obsecracin mas pequea es la gran mediana.
117
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
118
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ENFERMEDADES E.D.A SINDROME FEBRIL ANEMIA AMIBIASIS TOTAL
> 38 6 3 2 0 11
38 0 3 4 6 13
119
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
TOTALES 6 6 6 6 24
120
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Los tamaos de la muestra son pequeos usando X la regin corresponde
a valores de T = > 7.815 el cuantl 0.95 de X (c-1) = 3 ; T es
calculada usando
N
2
6
2
T = ------- ( )
o i nia N 1 /
ab i=1
(24)
2
( 6 - (6)(11)/ 24 )
2
( 3 - (6)(11)/ 24 )
2
T = ------------ ------------------------ + ----------------------- +
(11) (13) 6 6
(3 - (6)(11)/ 24 )
2
( 0 - (6)(11)/ 24 )
2
---------------------- + ------------------------
6 6

576 ( 6 - 2.75)
2
( 3 - 2.75)
2
( 3 - 2.75)
2
( - 2.75)
2
T = -------- ------------------ + --------------- + --------------- + -------------
143 6 6 6 6
( 6 - 2.75)
2
( 3 - 2.75)
2
( 3 - 2.75)
2
( - 2.75)
2
T = 4.02 ------------------ + --------------- + --------------- + -------------
6 6 6 6
10.56

0.0625 0.5625 7.562
T = 4.02 ( ------------------ + --------------- + --------------- + -------------)
6 6 6 6
T = 4.02 ( 1.76 + 0.01041 + 0.09375 + 1.26033)
T = 4.02 (3.12449) = 12.560449
121
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Debido que T = 12.560449 se tiene que T = > 7.815 ===> Ho es
rechazada, utilizando tabla se nota que el nivel critico es
ligeramente menor que 0.001 ====> = 0.001.
3.13. LA PRUEBA DE BONDAD DE AJUSTE DE KOLMAGOROV - SMIRNOV
Cundo se desea determinar qu tambin se conforma la distribucin terica
de los datos de la muestra o alguna distribucin terica , una prueba
conocida como prueba de bondad de ajuste de Kolmagorov -
Smirnov proporciona una alternativa a la prueba ji - cuadrada de
bondad de ajuste .
La prueba recibe su nombre de A. Kolmagorov y N.V Smirnov, dos
matemticos rusos quienes introdujeron dos pruebas ntimamente
relacionadas en la dcada de 1.930.
DATOS: Muestra aleatoria de X1, X2..... , Xn de tamao n asociada con
alguna funcin de distribucin desconocida denotada por F (x).
SUPOSICIONES:
(i) La muestra es aleatoria.
(ii) Si la funcin F * (x) en Ho es continua la prueba es exacta.
HIPTESIS: Sea F* (x) una distribucin completamente especificada.
(i) Bilateral:
Ho : F (x) = F * (x) x ] - , [
H1 : F(x) F * (x)
(ii) Unilateral
Ho : F (x) F* (x) x ] - , [
Hi : F (x) < F*(x)
(iii) Unilateral
Ho : F(x) F*(x) x ] - , [
122
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Hi : F(x) > F*(x)
PRUEBA ESTADSTICA:
Sea S(x) la funcin de distribucin emprica basada en la muestra aleatoria
X1 , X2, ...., Xn
(i) Bilateral
T1 mayor distancia vertical entre S(x) y F*(x)
T1 = Sup
x
F* (x) - S(x)
(ii) Unilateral : T
+
1

T
+
1 = Sup
x
[ F * (x) - S(x) ]
(iii) Unilateral : T1
T
-
1 = Sup
x
[ F* (x) -S(x) ]
REGLA DE DECISIN
Rechazar Ho al nivel de significancia si T1, T
+
1 o T
-
1 excede al cuantl
(1 - ) W1- dado por la tabla.
PROCEDIMIENTOS
(i) Sea F*(x) la funcin distribucin terica acumulada completamente
especificada bajo la hiptesis nula.
(ii) Sea Sn(x) la f de a muestra basada en n observaciones para
cualquier X observada,
k
Sn (x) =-------------, en donde k es el nmero de observaciones menores
n
iguales a X
(iii) Determinar la desviacin mxima T1 definida por
T1 = Sup
x
[ F* (x) - S(x) ]
123
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(iv) Si, para el nivel de significancia escogido, el valor observado de T1 es
mayor o igual que el valor crtico tabulado. La hiptesis deber ser
rechazada
EJEMPLO ILUSTRATIVO.
Una muestra aleatoria es obtenida del grupo de edad 45-59 aos al 1000%
a travs del cuadro estadstico (10 primeras causas de morbilidad por
consulta de urgencias del hospital San Francisco de Ass de la ciudad
de Quibd en enero - Diciembre / 94)
X1 = 0.198 X4 = 0.428 X7 = 0.134
X2 = 0.098 X5 = 0.083 X8 = 0.103
X3 = 0.052 X6 = 0.081 X9 = 0.017
X10 = 0.026
La hiptesis nula es la funcin de distribucin uniforme cuya expresin
matemtica para la distribucin hiptizada es:
0, si X < 0
F* (x) = X, si 0 X < 1
1, si 1 X
Formalmente la hiptesis es:
Ho: F (x) = F* (x)
H1: F (x) = F* (x)
Donde F (x) es la funcin de distribucin desconocida comn de los
Xi; i = 1... 10 y F* (x) es cuando se usa la prueba bilateral de
Kolmagorov para la bondad de ajuste.
La regin crtica de tamaos = 0.05 corresponde a valores de T1 mayor al
cuantl 0.95 igual 0.409 obtenido en tabla de T1 es obtenido
graficando la funcin de distribucin emprica S(x) encima de F* (x) .
F* (x) .
1
124
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
0.5
0.5 1
La distribucin hipotetizada de la funcin
Ho: F(x) F* (x) x
T1 = 0.290
S(x)

F*(x)
0.5 1.0
La mayor distancia vertical que separa las dos grficas es 0.290 lo cual
ocurre cuando X = 0.710 por que S (0.710) = 1 y F* ( 0.710 ) =
0.710 ==> T1 = Sup

F* (x) - S (x) = F*( 0.710) - S(0.710 =


0.710 - 1 = 0.290
125
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
As que T1 = 0.290 luego T1 es menor 0.409 ( T1 < 0.409 ) entonces Ho es
aceptada , el nivel crtico es visto en tabla y es mayor o igual que
0.20
3.14 LA PRUEBA U DE MANN - WHITNEY
Cuando se ha logrado por lo menos, una medida ordinal, la prueba U de
Mann - Wihitney puede usarse para probar si dos grupos
independientes han sido tomados de la misma poblacin. Es una de
las pruebas no paramtricas ms poderosa y constituye la alternativa
ms til ante la prueba t cuando el investigador desea evitar las
suposiciones que sta exige o si la medicin en u la investigacin es
ms vaga que la escala de intervalo.
DATOS: La prueba consiste en ordenar por rangos todas las puntuaciones
en orden creciente.
Sea n1 el nmero de casos ms pequeos de los dos grupos
independientes, n2 el nmero de casos del ms grande. Para aplicar
la prueba U, se empieza por combinar las observaciones o puntajes
de ambos grupos y luego se considera el grupo central.
SUPOSICIONES: Las siguientes suposiciones son necesarias para el uso
valido de la prueba U, en la verificacin de Ho que dos medias son
iguales:
(i) Cada una de las muestras ha sido tomada al azar de su poblacin
(ii) Hay independencia entre las observaciones dentro de cada muestra as
como entre las dos muestras.
(iii) La variable aleatoria que se est considerando es contina en ambas
poblaciones.
(iv) Los datos representan medida por lo menos en una escala ordinal.
(v) Las dos f . d. de poblacin si tienen alguna diferencia, se diferencian
solamente respecto de la localizacin.
HIPTESIS:
126
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La distribucin de muestreo del estadstico U puede ser aproximada
mediante la distribucin normal cuando tanto n1 como n2 son mayor
que 10 si se cumple esta condicin es posible utilizar la tabla de
distribucin normal estndar de probabilidad para efectuar la prueba .
(i) Prueba Bilateral:
Ho : u1 : u 2
H1 : u 1 u 2
(ii) Prueba unilateral o de una cola
Ho : u 2 u 1
H1 : u 2 > u 0
(iii) Prueba unilateral o de una cola
Ho : u2 u 1
H1 : u 2 < u 1
PRUEBA ESTADSTICA.
El estadstico U posee caracterstica que permite ahorrarse el tiempo de los
clculos , cuando las dos muestra en observacin son de tamao
desigual , para valores medianamente grande de n1 y n2 , el
procedimiento de contar para determinar el valor U puede ser
tedioso. Una alternativa que de resultados idnticos es asignar el
rango de 1 a la suma de puntajes ms baja de la combinacin n1 +
n2, el rango 2 al siguiente puntaje menor, y as sucesivamente. Por
lo tanto:

n1 (n1+1)
U = n1n2 + -------------------- - R1 igualmente
2

n2 (n2+1)
127
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
U = n1n2 + -------------------- - R2
2
REGLA DE DECISIN: La decisin de rechazar o no Ho en el nivel de
significacin depende de la magnitud de T y de cul de las
hiptesis i , ii , iii , se est verificando.
Se observan los siguientes criterios.
(i) Prueba de dos colas: Ho: u1 = u2 valores de T suficientemente
grande o suficientemente pequeo darn lugar al rechazo. Por lo
tanto, se rechaza Ho si la T calculada es menor que W /2 o
mayor que W1 - /2 donde W/2 es el valor crtico de T dado en
la tabla y W1 - /2 est dado por W1 - /2 = n1 n2 - W /2
(ii) Prueba de una cola: Ho: u1 u2 valores suficientemente grande de
T dan lugar al rechazo. Por lo tanto rechazamos Ho si T es mayor
que W1 - donde W1 - = n1 n2 - W
(iii) Prueba de una cola: Ho: u1 u2 valores suficientemente pequeo
de T dan lugar al rechazo. Por lo tanto rechazamos Ho si la T
calculada es menor que W , donde W , es el valor crtico de T
obtenido consultando la tabla para n1 , n2 y .
PROCEDIMIENTO.
Esto son los pasos para usar la prueba u de Mann - Whitney.
(i) Se determinan los valores n1 y n2. n1 es el nmero de casos en el grupo
ms pequeo, n2, el nmero de casos en el grupo ms grande.
(ii) Se ordenan junto los puntajes de ambos grupos, asignado el rango de 1
al puntaje que sea algebraicamente ms bajo. Los rangos van desde
1 hasta N = n1 + n2.
Se asigna a las observaciones ligadas al promedio de los rangos ligados.
(iii) Se determina el valor u contado. Por medio del estadstico y se toma
el criterio segn el caso de Ho.
128
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
EJEMPLO ILUSTRATIVO.
Pruebe la hiptesis de que no existe diferencia entre las causas de demanda
en consulta mdica por grupo de edad 15 - 44 y 45 -59 aos de
acuerdo al resumen mensual del ISS del Choc durante el mes de
Enero - Junio de 1995.
Teniendo en cuenta el orden de enfermedades ( 12 X 21 ), donde X es
el nmero correspondiente al orden en la tabla estadstica llevada por
dicha Institucin durante la fecha .
Edad ==> 15-44 aos ==> 4 8 29 53 62 39 63 25 42 27 39 26 20 32 24 73
Edad==> 45-59 aos ==> 36 38 67 46 48 57 54 25 23 26 36 33 29 32 23.
CAUSAS DE DEMANDA EN CONSULTA MDICA POR GRUPOS DE EDADES.
RESUMEN MENSUAL EN ORDEN CRECIENTE
RANGO N
PACI
ENTE
EDAD
(AOS)
RANGO N
PACIENTE
EDAD (AOS)
1 20 15 - 44 16 36 45 - 59
2 23 45 - 59 17 38 45 - 59
3 23 45 - 59 18 39 15 - 44
4 24 15 - 44 19 39 15 - 44
5 25 15 - 44 20 42 15 - 44
6 25 45 - 59 21 46 45 - 59
7 26 15 - 44 22 48 15 - 44
8 26 45 - 59 23 48 45 - 59
9 27 15 - 44 24 53 15 - 44
10 29 15 - 44 25 54 45 - 59
11 29 45 - 59 26 57 15 - 44
12 32 15 - 44 27 62 45 - 59
13 32 45 - 59 28 63 15 - 44
14 33 45 - 59 29 67 45 - 59
15 36 45 - 59 30 73 15 - 44
129
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Datos brutos y rangos del N pacientes obtenidos en la causa de demandas
en consulta Medica por grupo de edad resumen mensual en el I.S.S.
130
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
De enero - Junio de 1995
EDAD 15 - 44 RANGO EDAD 45 - 59 RANGO
20 1 23 2
24 4 23 3
25 5 25 6
26 7 26 8
27 9 29 11
29 10 32 13
32 12 33 14
39 18 36 15
39 19 36 16
42 20 38 17
48 22 46 21
53 24 48 23
62 27 54 25
63 28 57 26
73 30 67 29
RANGO TOTALES 236 229
131
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
n1 = 15 calculado u.; u = n 1 n 2 + n 1(n 1+1) / 2 - R1
n2 = 15 u = (15)(15) + 15(15+1) / 2 - 229
R1 = 229 u = 225 + 120 -229
R2 = 236 u = 345 - 229
u = 116, que es el estadstico de u.
Ahora calculamos a U con R
2:
u=
1
n
2
+ n
1
( n
1
+ 1 ) / 2 - R
2
u= (15)(15) + 15( 15 + 1) / 2 - 236
u = 109.
De estos estadsticos nos interesa el menor ( u = 109). Si se toma el valor
ms grande tendramos que aplicar la transformacin u = n
1
n
2
- 116.
Si la hiptesis nula de que n1 + n2 observaciones provienen de poblaciones
idnticas es verdaderas, este estadstico u tendr una
distribucin de muestreo con media de:
u
u
=
1 2
2
15 15
2
225
2
112 5
n n

( )( )
. Media del estadstico U
Error estndar del estadstico u
u
n n n n


+ +

+ +

1 2 1 2
1
12
15 15 15 15 1
12
6975
12
241
( )
( )( )( )
.
PRUEBA DE HIPTESIS.
La distribucin de muestreo del estadstico u puede ser aproximada
mediante la distribucin anual cuando n1 como n2 son mayores que
10 y dado que en este problema se cumple dicha condicin , es
posible utilizar la tabla de distribucin normal Standard de probabilidad
para la hiptesis de que estas muestras se extrajeron de poblaciones
idnticas.
132
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ho:
=
No hay diferencia entre las dos poblaciones, por lo cual tiene la
misma media.
H1 :


Hay una diferencia entre la dos poblaciones; en particular tienen
medias diferentes .
= 0.15
Dado que estamos utilizando la distribucin normal como distribucin de
muestreo en esta prueba (ver tabla) podemos determinar que el valor
correspondiente a Z para un rea de 0.425 es de 1.44, los dos lmites
de la regin de aceptacin se puede calcular as:
PRUEBA DE HIPTESIS DE DOS EXTREMOS EN EL NIVEL DE SIGNIFICANCIA DE
0.15

Uu - 1.44 Uu - 1.44
0.075 0.075

0.4251 0.425
Uu + 1.44 u = 112.5 + (1.44) (24.1) = 112.5 +34.704 = 147.2 ==> limite
superior.
Uu + 1.44 u = 112.5 - (1.44) (24.1) = 112.5 - 34.704 = 77.79 77.8 ==>
limite inferior.
133
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La figura muestra los limites de la regin de aceptacin 77.8 y 147.2 y el
valor de U calculado antes es de 109; se advierte que el estadstico
muestral U se encuentra dentro de 77.8 X 147.2 (regin). Por
tanto, se
acepta la hiptesis nula de que no existe diferencia y se infiere que los
afiliados que requieren consulta mdica en el ISS de acuerdo a las
edades 15 -44 y 45 -59 aos son iguales .
3.15 LA PRUEBA DE KRUSKAL - WALLIS.
El contraste o prueba de Mann - Wnitney se puede extender a situaciones
en que comparan 3 o ms grupos , y entonces se le conoce como
prueba H , tambin como prueba o Anlisis de Varianza de
Kruskal - Wallis, por el nombre de Willian H . Kruskal y de W.
allen Wallis quienes por vez primera sugirieron su empleo en 1.952.
El anlisis de varianza de una clasificacin por rangos de Kruskal - Wallis
es una prueba extremadamente til para decidir si K muestras
independientes son de poblaciones diferentes.
DATOS: Sea nj ( j = 1 , 2, ...k) el nmero de observaciones en la
j- sima muestras.
Primero se combinan todas las muestras k y se arreglan las
N = n1 + n2 +.... + nk observaciones en un orden ascendente ,
sustituyendo el rango apropiado de 1 , 2 , ... , n para cada
observacin . En el caso de empate (observaciones idnticas) se
sigue el procedimiento usual de reemplazar las observaciones por las
medias de los rangos que las observaciones tendran si fueran
diferentes, la suma de los rangos correspondientes a las nj
observaciones en la muestra j se representa por la variable aleatoria
Rj
SUPOSICIONES
A diferencia del anlisis de varianza de un solo factor, sin embargo, este
contraste no exige suposiciones de distribucin normal de la
poblacin y de homogeneidad de la varianza.
Todo lo que supone es que la variable aleatorio respecto de lo cual se van a
comparar los diversos grupos tenga distribucin continua. Requiere,
por lo menos, una medida ordinal de la variable.
134
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
HIPTESIS
La hiptesis de nulidad Ho que se va a contrastar es que los medio de las
J poblaciones de donde proceden las muestras son idnticas; la
alterna H1 es la de que son diferentes.
Ho : u1 = u2= u3 = uj
H1 : u1 u2 u3 = uj
PRUEBA ESTADSTICA
La estadstica usada en la prueba de kruskal - wallis, definida por la frmula
que se da enseguida est distribuida como Chi cuadrada ( X ) con
gl = k - 1, siempre que los tamaos de las diferentes k, muestras no
sean demasiado pequeas.
12 R
j
H =-------------
k

j=1
--------- - 3 (n + 1)
n( n + 1) n j
Donde
K = Nmero de grupos
nj = Nmero de casos en la muestra de orden j
n = nj , el nmero de casos de todos las muestras combinadas.
Rj = Suma de rangos en la muestra de orden j.
REGLA DE DECISIN
135
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Si H cae en la regin crtica H > X con gl = k - 1 , se rechaza Ho
al nivel de significancia , de otra manera se acepta Ho.
PROCEDIMIENTOS:
Esto son los pasos para el uso de la prueba o anlisis de varianza de
Kruskal - Wallis,
(i) Se ordenan todas las observaciones de los k grupos en una serie,
asignando rangos de 1 a n
(ii) Se determina el valor R para cada uno de los k grupos de rangos
(iii) Se usa el estadstico dependiendo del tamao de k y del tamao de
los grupos y se toma la decisin conforme Ho y con gl = k - 1.
EJEMPLO ILUSTRATIVO.
Los siguientes datos representan el nmero de afiliados que fueron a
consulta mdica en el ISS del Choc, en un mes, por tres tipos de
enfermedades.
Causas de Demanda en Consultas Mdicas por Grupos de Edades - Resumen Mensual
De Enero - Junio de 1995
ORDEN CAUSAS MENORES
DE 1
AO
1 - 4 5 - 14 15 - 44 45 - 59 60 Y MS
9
E.D.A.
43 49 85 62 40 51
12
SNDROME
FEB
RIL
29 38 45 48 36 44
19
ASMA
5 18 27 42 25 24
136
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Utilice la prueba de Kruskal - Wallis, al nivel de significancia de 0.05 para
probar la hiptesis de que existe una diferencia significativa entre el
nmero de afiliados que fueron a consulta mdica al ISS de Enero -
Junio de 1995 por E.D.A, Sndrome Febril y Asma.
La siguiente tabla muestra el nmero de afiliados que fueron a consulta
mdica al ISS del Choc durante Enero - junio de 1995 por Eda (E),
Sndrome febril (S) y Asma (A).
137
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
RANGO N
PACI
ENTE
ENFERMED RANGO N
PACI
ENT
E
ENFERMED.
1 5 A 6 29 S
2 18 A 7 36 S
3 24 A 8 38 S
4 25 A 9 40 E
138
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
5 27 A 10 42 A
139
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
140
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
RANGO
N
PACI
ENTE
ENFERM. RANGO N
PACI
ENTE
ENFERM.
11 43 E 16 51 E
12 44 S 17 62 E
13 45 S 18 85 E
14 48 S
141
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
15 49 E
142
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Rangos de las tres enfermedades por la cual los Afiliados asistieron al ISS
durante Enero - Junio de 1995.
143
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ENFERMEDADES
E S A
9
11
15
16
17
18
6
7
8
12
13
14
1
2
3
4
5
10
144
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
RE= 86 RS = 60 RA =25
N = 18, nE 6, nS= 6, nA = 6, RE = 86, RS = 60, RA = 25
Ho : p1 = p2 = p3
H1 : no son iguales las tres medias
= 0.05
Regin Critica h > X
2
0.05
= 5.991 para V = 2 (grados de libertad)
El estadstico de la prueba H asume el valor:
H
n n n
n
j
j j
k
R

+
+

12
1
3 1
2
1
( )
( )
95 . 10 ) 19 ( 3
66
2 ) 25 (
6
2 ) 60 (
6
2 ) 86 (
) 1 18 ( 18
12

1
]
1

+ +
+
H
H = 10.95
Luego se decide que como h = 10.95 cae en la regin crtica h > 5.991 se
tiene suficiente evidencia para aceptar la hiptesis de que existe una
diferencia significativa entre el nmero de afiliados que fueron a
consulta mdica al ISS de Enero - Junio de 1995 por E.D.A,
Sndrome Febril y Asma.
3.16 LA PRUEBA DE SPEARMAN
Una de las medidas de correlacin ms simple y de ms uso para el caso de
dos variables, es el coeficiente de correlacin por rango de
Spearman; denotado por rs, y que fue propuesto por Carl
Spearman en l.904.
Esta estadstica, a veces llamada r h o, es una medida de asociacin que
requiere que ambas variables sean medidas por lo menos en una
escala ordinal, de manera que los objetos o individuos en estudios
pueden colocarse en dos series ordenadas.
DATOS: Su pongamos que N individuos son ordenados de acuerdos con
dos variables. X y Y , con X = X1 + X2 + X3 + Xi + Xn
145
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Y = y1 +y2 + y3 + yi +... + yn. Podemos ver que la correlacin; ser perfecta
s y slo s Xi = yi i. Por consiguiente, parece lgico usar las
distintas diferencias di = xi - yi como una indicacin de la disparidad
entre los dos conjuntos de rangos.
SUPOSICIONES
(i) X e y son independientes y continuas.
(ii) Ambos variables sean medidas por lo mayor en una escala ordinal
HIPTESIS: Podemos emplear el coeficiente de correlacin por rango
Spearman como un estadstico de prueba para verificar la
independencia entre X e y.
Las hiptesis que se pueden verificar y las hiptesis alternas, son:
(i) Prueba Bilateral
Ho : X e y son mutuamente independientes.
(ii) Prueba Unilateral
Ho : X e y son mutuamente independientes
H1 : Valores grandes de X tienden a aparearse con valores grandes de y .
(iii) : Prueba Unilateral
Ho : X e y son mutuamente independientes
H1 : Valores grandes de X tienden a aparearse con valores pequeos de y.
PRUEBA ESTADSTICA

146
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

s r
d
n n

1
6
1
2
2
( )
Donde:
rs = Coeficiente de correlacin por rango
n = Nmero de observaciones pareados ( # de pares de datos)
d = Sumatoria de las diferencias entre los rangos asignados a Xi y yi.
REGLA DE DECISIN
Si n est entre 4 y 30, comparan el valor calculado de rs , para la
significacin , con el valor crtico apropiado de r *s dado en la
tabla
(i) Bilateral
Rechazar Ho en el nivel de significancia si rs > r *s o
rs - rs <r *s sabiendo que r *s, est localizado en la
interseccin de la columna marcada con /2 y la fila correspondiente
a n
(ii) Unilateral:
Rechazar Ho si rs > r *s, para y n
(iii) Unilateral:
Rechazar Ho si rs > r *s, para y n, Cuando n es mayor que 30, puede
calcularse
t r
n
s
s r

2
1
2
147
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
148
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Para la significacin, con valores apropiados de la distribucin t de
Student, con n - 2 gl.
Tambin se puede calcular el estadstico
Z n
s r
1
Y compararlo, para la significancia, con valores apropiados de la distribucin
normal estandarizada.
Si hay un gran nmero de empates, se puede utilizar el siguiente
procedimiento.
(i) Calcular T
t t


3
12

Donde t es el nmero de observaciones empatadas para un rango dado en
las X o en las y
(ii) Calcular
S r
x y d
x y

+


2 2
2 2
2
Donde


2
3
12
x T
n n
x



2
3
12
y
T
n n
y



Tx = la suma de los valores de T para los rangos empatados de X
Ty = La suma de los valores de T para los rangos empatados de y
149
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
A menos que el nmero de empates sea demasiado grande, utilizando
cualquiera de los mtodos se obtendr una diferencia muy pequea
en el valor de rs.

PROCEDIMIENTO
(i) Dado n pares de medidas de X e y , Obtener el rango de los valores
de X desde 1 hasta n ( asignando el rango 1 al valor ms `pequeo
de X ) y el rango de los valores de y desde 1 hasta n ( asignando el
rango 1 al valor ms pequeo de y ).
(ii) Para cada par de observaciones, calcular di = (rango de xi) -
(rangos de yi)
(iii) Elevar al cuadrado cada di y calcular d

Calcular
S r
n
d
n

1
6
1
2
2
( )
y comparar segn lo prescrito en la
hiptesis.
EJEMPLO ILUSTRATIVO.
La hipertensin arterial es la enfermedad caracterizada, por la elevacin
persistente o mantenida de la presin sistlica, diastlica o ambos,
demostrable por lo menos en tres temas fortuitas y que evoluciona de
acuerdos con la forma clnica que adopte.
Los factores que al parecer guardan una mayor relacin con la hipertensin
arterial son: Edad, Raza, Herencia, Obesidad y dieta rica en sodio.
En la Caja de Previsin Social del Magisterio del Choc, se tomaron lecturas
de la presin sangunea a 20 maestros entre las edades de 22 - 55
aos.
150
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Datos presentados en la siguiente tabla.
EDAD Y PRESIN SISTOLICA SANGUNEA (mm.Hg) DE 20 MAESTROS DE QUIBDO -
CHOCO.
Nmero del Maestro Edad (x) Valor Pres. Sistlica (mm.Hg) (y)
1 22 132
2 24 130
3 26 115
4 28 138
5 30 140
6 33 158
7 35 128
8 36 145
9 38 160
10 40 156
11 41 162
12 43 150
13 45 125
14 46 155
15 48 170
16 49 165
17 50 164
18 52 174
19 53 180
20 55 172
Se desea saber si puede concluir que el valor de la presin sistlica
(mm.Hg) est inversamente correlacionada con la edad.
Entonces, las hiptesis para la prueba unilateral son:
Ho: La presin sistlica (mm.Hg) y la edad son mutuamente independientes.
H1: Existe una tendencia para crear que con la edad la presin sistlica
crece. Suponiendo un = 0.05.
151
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
ORGANIZANDO LOS ANTERIORES DATOS POR RANGOS TENEMOS
N del Maestro Rango (x) Rango (y) Di d
l
i
1 1 5 -4 16
2 2 4 -2 4
3 3 1 -2 4
4 4 6 -2 4
5 5 7 -2 4
6 6 12 -6 36
7 7 3 4 16
8 8 8 0 0
9 9 13 -4 16
10 10 11 -1 1
11 11 14 -3 9
12 12 9 3 9
13 13 2 11 121
14 14 10 4 16
15 15 17 -2 4
16 16 16 0 0
17 17 15 2 4
18 18 19 -1 1
19 19 20 -1 1
20 20 18 2 4
d
2
i = 270
Sustituyendo los valores de la tabla de rangos en la ecuacin:
S
i
s
d
n n

1
6
1
2
2
( )
( )
Sr r


6 270
20 20 1
1
1620
7980
1 0 20
2
( )
( )
,
rs = 0.80
Consultando en la tabla se observa que, para una prueba unilateral, = 0.05
y n = 20, el valor crtico de r*s es 0.377. Como ELrs = 0.80 calculado
es mayor que el valor crtico r*s se rechaza Ho y se concluye que las
dos variables estn inversamente relacionadas. Es decir, que con la
edad la presin sistlica crece.
152
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
UNIDAD N 4
ASPECTOS GENERALES SOBRE
SERIES CRONOLGICAS, NMEROS NDICES Y TASA
OBJETIVO
DE LA UNIDAD: Identificar, describir y analizar series de tiempo, determinar la importancia
de la tendencia y dems componentes de una serie de tiempo,Identificar, manejar e
interpretar correctamente nmeros ndices, desarrollar destrezas en la aplicacin de los
nmeros ndices en la gestin administrativa.
CONTENIDOS:
4.0 Series cronolgicas.
4.1Componentes de una serie.
4.2Determinacin de la tendencia.
4.3Ajuste rectilneo.
4.3.1Mtodo de mano alzada.
4.3.2 Mtodos de los puntos seleccionados.
4.3.3 Mtodos de los semipromedios.
4.3.4 Mtodo de los mnimos cuadrados.
4.4 Los nmeros ndices.
4.5 Usos de los nmeros ndices.
4.6 Proporciones, porcentajes, razones y tasas.

153
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
4.0 SERIES CRONOLOGICAS:
Las series cronolgicas son casos de distribuciones bidimensionales, donde
X corresponde a la variable tiempo (aos, meses, das) y Y a la variable que
se estudia (produccin, ventas, precios, exportaciones, etc.)
Las series cronolgicas, denominadas tambin series de tiempo, se pueden
definir como una coleccin de datos que pertenecen a diferentes periodos.
Estas series son de gran importancia en cualquier empresa u organismo, no
solo para conocer la situacin actual o el comportamiento de una variable en
el periodo observado sino para establecer la tendencia futura. Predicciones
de produccin, ventas, empleo, ingreso, poblacin, precios y muchas otras
variables socio-econmicas necesarias para estudiar, para planear
actividades futuras de una empresa.
Los movimientos que presentan una serie de tiempo, son producidos por una
variedad de factores de carcter econmico, natural o institucional.
Parte del anlisis de estas series, consiste en descubrir y cuantificar dichas
influencias.
Los principales factores que afectan una serie de tiempo son: tendencia,
variaciones estacinales, variaciones cclicas y variaciones aleatorias.
4.1 COMPONENTES DE UNA SERIE :El anlisis de una serie consiste en
investigar los siguientes cuatro componentes cuya actuacin conjunta da
como resultado los valores observados:
154
a) Tendencias secular o regular: son variaciones suaves y constantes que se sucede en el periodo
relativamente largo. El periodo debe ser largo, generalmente mas de cinco periodos (podrn ser aos,
meses, etc.), para poder establecer una lnea de tendencia (recta parablica o exponencial) que sea
representativa o significativa.
b) Variaciones estacinales: stas, generalmente, estn ligadas a las estaciones del ao (verano,
otoo, invierno y primavera); tambin corresponde a cambios peridicos que se repiten en intervalos de
tiempo ms cortos, por ejemplo, el consumo de energicen las 24 horas del da; el movimiento de
pasajeros en buses de servicios urbanos, en un da, etc.
c) Variaciones cclicas: son fluctuaciones a largo plazo, ms o menos peridicas, que se repiten cada
cierto numero de aos, y que, a diferencia de las variaciones estacinales, es difcil determinar el periodo
o ciclo, ya que no se puede saber con exactitud cuando comienza y cuando termina, tal es el caso de las
fluctuaciones cclicas originadas en la actividad econmica (crisis recuperacin auge - depresin).
d) Variaciones aleatorias, accidentales o errticas: son aquellos cambios que se presentan en forma
accidental, siendo difcil su prediccin. Por ejemplo, terremotos, inundaciones, huelgas, etc.
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
En resumen, la variable Y para algunos autores, es la suma de los anteriores
factores, de tal manera que Y= T + VE+VC+VA; para otros, es el resultado
del producto de estos factores. Y = T. VE. VC. VA. Sin embargo, no faltan
Resumiendo diremos que el movimiento de una serie cronolgica se
compone de las siguientes suposiciones:
Un movimiento de traslacin, T(t).
Un movimiento vibratorio (variacin estacional), VE.
Un movimiento de oscilacin (Variacin cclica) VC.
Un movimiento perturbador (variacin aleatoria) VA.
Modelo o esquema aditivo: se considera que la serie est formada por la
suma de los anteriores factores, de tal manera que
Y= T(t) + VE + VC + VA
Modelo o esquema multiplicativo: es el resultado del producto de estos
factores
Y = T(t). VE. VC. VA.
Sin embargo, no faltan aquellos que se consideren que Y es el resultado de
la combinacin de suma y producto de estos factores.
La diferencia entre los modelos aditivos y multiplicativos, es que los
componentes en el primero se consideran como residuos y expresan en
unidades originales en el segundo, la tendencia se expresa en cantidad o
valor y los otros componentes en trminos porcentuales o relativos.
En la representacin grafica, tomando periodos mensuales o semanales, se
pueden observar mejor las variaciones estacinales, como las aleatorias, esa
es la razn por la que no se representan en la siguiente figura

155
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
4.2 DETERMINACIN DE LA TENDENCIA.
La tendencia puede tomar diferentes formas: rectilnea, parablica,
exponencial o cualquier otra lnea. La seleccin debe ser aquella que mejor
represente a ese conjunto de puntos. La grfica ayuda mucho a determinar la
forma de la lnea y la direccin que toma. Sin embargo, puede afirmarse, que
no es posible visualizar con absoluta certeza la bondad de su adaptacin,
pues solamente el juicio personal y la experiencia del estadstico, son los
elementos que se pueden poner en juego en la eleccin del mejor ajuste.
La representacin grfica se debe hacer en un plano cartesiano. En el eje
horizontal o abscisa se coloca el tiempo (aos, meses, semanas, das, etc.),
en el eje vertical u ordenada se anotan los valores correspondientes a la
variable y(produccin, precios, ventas etc.). Para cada unidad de tiempo
corresponder un valor, Y, el cual se representa en el plano mediante un
punto, y habr tantos puntos como perodos observados tengamos, los que
al ser unidos, darn una lnea, que insina la tendencia que presenta esa
serie, y que al ser establecida, se refleja en una lnea ms sencilla que la
poligonal dada por los datos originales, al mismo tiempo, nos permite
establecer cul ser el comportamiento futuro de esa variable.
Algunos critican este proceso de vaticinio, por el hecho de estar
fundamentado en cifras histricas, que reflejan una vivencia del pasado. Sin
embargo, es un hecho, que cualquier proceso futurista necesita
fundamentarse en el presente y en el pasado. Se debe tener en cuenta que
el comportamiento futuro de la variable, depender de las condiciones bajo
las cules se dieron las informaciones; por esa razn se recomienda que una
prediccin no sea mayor de cinco aos, ya que las condiciones pueden variar
156
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
por diferentes razones. Por otra parte, una buena seleccin de la lnea nos
dar una mejor aproximacin entre el valor estimado y el valor real.
Su importancia, en cualquier empresa, no es discutible. En la vida comercial
es interesante conocer las fluctuaciones de las ventas a travs del tiempo,
las causas que originan esas variaciones, y el comportamiento futuro; todo
esto har pensar sobre una posible ampliacin o reduccin de los inventarios
de mercanca, del volumen de la produccin, precios, espacio fsico, etc.
Una lnea que sea seleccionada para representar la tendencia de una serie
cronolgica continuar en la misma direccin, si las condiciones que la
originan permanecen constantes. Por esto, al trazar una lnea, ya sea recta,
parablica o exponencial, debemos analizar en primer lugar las causas, y
evaluar la probabilidad de que as ocurra, antes de iniciar cualquier proceso
de estimacin.
4.3 AJUSTE RECTILNEO
Existen varios mtodos para el ajuste de una recta en una serie cronolgica.
Entre ellos podemos mencionar:
Mtodo de mano alzada.
Mtodo de los puntos seleccionados.
Mtodo de los semipromedios
Mtodo de los mnimos cuadrados (este mtodo fue visto en el curso de
estadstica uno)
4.3.1 Mtodo de mano alzada o mtodo grfico.
Este mtodo se le conoce tambin con el nombre de mtodo grfico. Es muy
utilizado por personas con mucha experiencia; con su aplicacin se obtienen
resultados muy satisfactorios, especialmente cuando la serie presenta muy
pocas variaciones o stas se producen en forma suave. El inconveniente que
presenta este mtodo, es la no existencia de un instrumento que juzgue
adecuadamente la bondad de la lnea, por otra parte, por ms experta que
sea la persona, una serie puede dar origen a diferentes lneas, de ah que se
le considere como un mtodo muy subjetivo. Con una buena experiencia
sobre el comportamiento de la variable, se puede lograr una buena
estimacin, muchas veces mejor que la obtenida mediante el mtodo
matemtico.
El proceso que se sigue en la aplicacin del mtodo de mano alzada,
consiste en dibujar la lnea poligonal correspondiente a los datos originales,
luego se estudia su comportamiento, para despus trazar una lnea recta a
mano alzada a travs de esos puntos. Si se prolonga la lnea hasta el ao
que se desea estimar, leeremos en el eje vertical el valor, precio o cantidad
157
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
de Y para ese ao. Algunos consideran que una vez trazada la lnea
(cuando es recta), se pueden determinar dos puntos, especialmente el
primero y ltimo y luego, obtener una ecuacin matemtica para que refleje
la lnea de la tendencia.
1998 1999 2000 2001 2002 2003 2004 2005
En el primer caso, la produccin estimada para el 2005 podra ser
aproximadamente de 174 millones de pesos, si consideramos que puede
bajar de acuerdo a la experiencia.
En el segundo caso, los puntos se localizan en los aos 1998 y 2002. Siendo
los valores de 50 y 150, con los cuales determinamos el crecimiento anual en
la siguiente forma:
b 25
4
50 150
1998 2002
1 2

punto punto
Siendo la ecuacin general Y = b x + c, se tendr que: Y* = 25 x + 50. El
valor de x ser el tiempo transcurrido entre 1998 y 2005, igual a 7.
Reemplazando tenemos Y* = 25(7) + 50 = 225 el cual ser el valor estimado
en el 2005.
4.3.2 Mtodo de los puntos seleccionados.
158
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Este mtodo consiste en localizar dos puntos en la serie, ojala uno al inicio
de la serie y el otro al final de la misma, luego se determina la diferencia que
existe entre ellos y se divide, por el nmero de perodos transcurridos entre
esos perodos, teniendo en cuenta al iniciar el conteo, considerando cero
para el primer punto o perodo.
Si sealamos por P1, el valor del primer punto de la serie, P2; el del segundo
valor y t el nmero de unidades de tiempo transcurrido entre P1, y P2, se
tendr el incremento, por unidad de tiempo, simbolizado por b, siendo igual
a:
b
t
P P
1 2

Considerando que la ecuacin general de la recta est dada por la ecuacin
Y = bx + c se tendr que el valor de c ser igual al primer valor de Y
simbolizado por P1.
Ejercicio 1.
Supongamos que una empresa tiene una serie de datos, sobre el valor de la
produccin (en millones de pesos).
AOS PRODUCCIN
(millones de pesos)
a) Representar grficamente dicha serie.
b) Ajustar una recta al conjunto de puntos.
1998
32
c) Estimar el valor de la produccin para el 2009.
1999 24
2000 38
2001 54
2002 42
2003 66
2004 84
Solucin:
Los aos 1999 y 2003 se sealan con asterisco para indicar los puntos
seleccionados en la serie;
P1, = c = $24 millones P2; = $ 66 millones
Siendo
P2-P1 66 24 42
159
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
b = ------- = -------------- = ----- = 10.5
t 2003 1999 4

AOS y Xi Y*
1998 32 -1 13,5
*1999 24 0 24,0
2000 38 1 34,5
2001 54 2 45,0
2002 42 3 55,5
*2003 66 4 66,0
2004 84 5 76,5
CALCULO DE Y*
10,5 (-1) + 24
10,5 (0) + 24
10,5(1) + 24
10,5(2) + 24
10,5 (3) + 24
10,5(4) + 24
10,5 (5) + 24
El incremento anual es de $ 10,5 millones; adems sabiendo que c = 24,
podemos escribir la ecuacin para la tendencia en la serie, como:
160
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Y* = bX + c siendo b=10,5 ; c= 24
Con la ecuacin Y = 10,5 X + 24, se hace necesario establecer el valor de X
para hacer la estimacin de Y en el perodo 2009; se tendr que: X = 2009 -
1999 = 10 aos, por lo tanto: Y = 10,5 (10)+ 24 = 129. Aproximadamente
para el 2009, la produccin tendr un valor de 129 millones de pesos.
Si examinamos detenidamente el anterior mtodo, observaremos:
Es un proceso muy parecido al mtodo grfico, pero un poco ms
refinado.
No toma en cuenta sino dos valores de la variable, as que el
crecimiento por cada unidad de tiempo (b) no queda influenciado por
los dems valores.
Quizs el aspecto ms negativo que presenta este mtodo, es el
dejar en libertad a investigador la seleccin de los dos puntos de
referencia.
Si tomamos a P1 = 24 y P2 = 42, el coeficiente angular o el crecimiento por
cada unidad de tiempo cambia, siendo en este caso ms bajo que el
obtenido anteriormente.
42 24 18
b= -------------- = ----- = 6 < 10,5
2002-1999 3
De todas maneras, es una forma de obtener una estimacin ms rpida que
por cualquier otro procedimiento utilizado.
4.3.3 Mtodo de los semipromedos.
El empleo de este mtodo conlleva a una simplificacin de clculo, pero, al
igual que los anteriores, presenta el inconveniente de no utilizar la totalidad
de los datos, por otra parte, al incorporar uno o ms datos en la serie se
deben rehacer todas las operaciones.
El procedimiento que se sigue en el clculo es:
161
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Se divide la serie en dos partes, en tal forma que cada parte contenga un
nmero impar de perodos. En algunos casos habr necesidad de ignorar
algunos perodos, especialmente los primeros de la serie.
Se obtiene la suma de yi para cada una de las partes. El valor de la suma
se coloca al frente de la observacin central, en la columna denominada
semisuma.
Cada semisuma se divide por el nmero de perodos que contiene cada
parte de la serie, obteniendo as los valores para los semipromedios.
De ah en adelante, se consideran dos mtodos para hallar los
parmetros b y c, obtenindose con su aplicacin los mismos resultados.
Consideremos los datos de la tabla.
Si se tiene que la ecuacin general de la recta es Y = b x + c se tendrn
dos ecuaciones normales:
(1) 31,33=1b+c (2) 64=5b+c
El valor de X depender del tiempo transcurrido desde el perodo que se
toma como origen. En este ejercicio, se estableci como origen el primer
perodo. Siendo una serie continua, se tendrn para X valores de O, 1, 2,
etc., (ver la tabla) a partir de ese origen.
Si multiplicamos la ecuacin (1) por -1 y el resultado obtenido se lo restamos
a (2), as se obtendr el valor del coeficiente angular b:
Tabla 10.1
Conociendo el valor de b, lo reemplazamos en la ecuacin (1):
31,33= 8,17+c siendo: c = 31,33 - 8,17 = 23,16
162
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La ecuacin quedar as Y* = 8,17x+ 23,16
Si se quiere estimar el valor de Y* para el 2009 se tendr que x = 2009 -
1998 =11 por lo tanto Y*(2009) = 89,87 + 23,16 = 113,03
Tambin se puede utilizar otro procedimiento para calcular los parmetros b
y c.
1 = primera semisuma 2 = segunda semisuma
T1, = nmero de perodos en la primera parte de la serie.
T2, = nmero de perodos en la segunda parte de la serie.
2 - 1 192 94 98
b= --------- = ---------- = ------- = 8,17
T1(n-T2) 3 (7-3) 12

2 + 1 192 94 286
c= ----------- = ---------- = ------- = 47,67
T1 + T2 3 +3 6
Y* = 8,17 X + 47,67
El origen est localizado en el centro de la serie, en este caso en 2001,
donde x = O,
Si estimamos el valor de Y* para el 2009, se tendr en primer lugar que x es
igual a la diferencia entre 2009 y 2001. x = 2009 - 2001 = 8
Reemplazando en la ecuacin general:
Y*(2009) = 8,17 (8) + 47,67 = 65,36 + 47,67 = 113,03
Con un resultado exactamente igual al obtenido por el mtodo
anterior.
Otra forma ms elemental de hacer los clculos es:
163
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
b
17 . 8
1999 2003
33 . 31 64
1
2


t
X X
Si consideramos como c = 31,33 en este punto X= O, la ecuacin ser:
Y* = 8,17 X + 31,33
Si deseamos estimar Y* para el 2009, se tendr que:
x = 2009 - 1999 = 10 Y(2009) = 8,17 (10) + 31,33= 81,70 + 31,33 = 113,03
4.3.4 Mtodo de los mnimos cuadrados.
Los mtodos anteriores permiten establecer una ligera aproximacin a la
tendencia que presenta la serie. El mtodo ms utilizado, para realizar un
buen ajuste, es el conocido como el de los mnimos cuadrados. Este mtodo
no lo veremos en este modulo por que fue visto en el modulo de estadstica
uno.
LOS NMEROS NDICE
Una parte fundamental de la estadstica es la reduccin de grandes
volmenes de datos a formas en que se puedan hacer comparaciones y
sacar conclusiones. As la media, desviacin estndar, y otras funciones
describen una distribucin de frecuencia. La tendencia y los ndices de
estacin, por su parte describen series de tiempo. Los nmeros ndice son
medidas estadsticas de datos relacionados, y se los utiliza para comparar
estos datos a travs del tiempo, sobre un territorio o de otras formas. En la
prctica de administracin y la economa usualmente se tiene la dificultad de
no poder relacionar una variable en un momento determinado, con la misma
variable pero en otro momento. Los nmeros ndice son la herramienta con la
cual se puede hacer este tipo de comparaciones que pueden referirse a
precios, costos, ganancias etc.
Generalmente es posible sumar elementos de la misma clase si todas las
medidas estn expresadas en las mismas unidades. Es posible medir la
produccin anual de trigo de un pas sumando la que producen los
agricultores individualmente, aqu todos los kilogramos de trigo son los
164
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
iguales, entonces el valor de la produccin total tendr sentido. Cuando se
quiere medir el compuesto de cambios en la produccin de varios artculos,
que no se expresan en las mismas unidades de medida, no se podr sumar
las producciones ni promediarlas, en este caso se hace necesaria la
utilizacin de los nmeros ndice.
Los nmeros ndices son cifras relativas expresadas en trminos
porcentuales, que sirven para indicar las variaciones que presenta una serie
de observaciones, cuando se comparan respecto a una de ellas, tomada
como punto de referencia, denominada perodo base.
Por lo general, los nmeros ndices se constituyen en series cronolgicas
cuando se utilizan para indicar las variaciones porcentuales de una variable a
travs del tiempo.
En una serie corta, el perodo base corresponder al primer valor de la
misma; en una serie larga, debe seleccionarse aquel perodo que haya sido
ms estable, es decir, que no presente cambios bruscos debido a factores,
ya sean internos o externos. En algunas ocasiones, la seleccin del perodo
base depender de lo que se quiera presentar, por ejemplo si se examina
una serie referente a los precios de un artculo, se tendr que el ndice de
variacin ser mucho ms alto, cuanto ms lejano se encuentre el perodo
base; y ser ms bajo cuanto ms cercano est ese perodo.
Los nmeros ndices son muy usados en el anlisis de las ventas,
produccin, precios, costos, beneficios, aumentos de capital, comercio
exterior, etc., y en especial cuando se quiere comparar dos series, como por
ejemplo, los cambios en los precios de dos o ms artculos durante un
determinado perodo de tiempo. Por lo tanto habr necesidad de tener
cuidado con su uso, pues a diferencia de lo que la mayora cree, el ndice no
mide, slo es un indicador que pretende reflejar el comportamiento de ciertas
observaciones en forma aproximada.
Segn su composicin, el ndice puede ser: simple o compuesto. A su vez
los ndices compuestos se clasifican en agregativos y de promedios. Los
promedios, a su vez, se clasifican en aritmticos, geomtricos, medianos,
etc., siendo los ms utilizados los aritmticos.
Un nmero ndice es un indicador diseado para describir los cambios de
una variable en el tiempo, esto es, su evolucin a lo largo de un determinado
perodo.
165
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Pueden intentar reflejar:
la evolucin en la cantidad de un determinado bien o servicio o de un
conjunto de ellos (por ejemplo cantidades producidas o consumidas).
la evolucin en el precio de un bien o servicio o conjunto de stos.
la evolucin en el valor de un bien o servicio o de una canasta de bienes
y servicios.
En el caso de un bien o servicio determinado, el valor corriente, se expresa
como el producto del precio por la cantidad correspondiente a un perodo
establecido.
Las cantidades se miden en magnitudes fsicas y pueden expresarse
simplemente por el nmero de artculos producidos o por un nmero preciso
de unidades escalares de longitud, de volumen o de peso. Es imperativo que
la unidad fsica utilizada sea identificable, ya que de otra forma la nocin de
precio no tiene sentido. El precio es la cantidad de dinero pagada por cada
unidad de producto (bien o servicio); por eso es indispensable especificar de
qu unidad fsica se trata. La afirmacin de que el precio del trigo es de 40
dlares no aporta absolutamente ninguna informacin a menos que se sepa
que se est hablando de onzas de trigo, o de libras, o de kilos, o de
toneladas.
Los indicadores de cantidad, slo tienen sentido en el caso de un producto
nico y homogneo; cuando se trata de varios productos, expresados en
unidades fsicas diferentes, es imposible sumar las cantidades, porque las
unidades respectivas no son conmensurables. Por la misma razn, no tiene
sentido ni utilidad sumar precios. En cambio, los valores es decir, el
resultado de multiplicar los precios por las cantidades- s son aditivos y
constituyen la base de todas las operaciones de agregacin econmica.
Importa establecer una clara distincin entre precios y valores. Un valor es el
producto (matemtico) resultante de la multiplicacin de un precio por una
cantidad. Un precio puede considerarse como el valor de una sola unidad de
un producto dado, de donde se desprende que el nico caso en que valor y
precio son sinnimos es el caso especial de una sola unidad de un bien.
A los efectos de la elaboracin de un determinado ndice, se debe tomar
como referencia un determinado perodo base. La eleccin del ao o perodo
base parte de la necesidad de un punto de comparacin temporal.
166
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ejemplo Ejemplo
Para un determinado bien o servicio, se dispone de la siguiente informacin
sobre cantidad, precio y valor. Si la cantidad est expresada por ejemplo en
trminos de toneladas, el precio ser precio por cada tonelada. Si la cantidad
est expresada en trminos de horas, el precio ser por cada hora. El valor,
como fue sealado, ser el producto del precio por cantidad.
PERIODO CANTIDAD (q) PRECIO(p) VALOR (p*q)
0 125 2 250
1 181 2.5 452.5
2 205 2.8 574
3 115 2.9 333.5
El clculo de ndices de cantidad, precio y valor, tomando como perodo de
referencia (perodo base) el perodo 0, dar los siguientes resultados:
PERIODO NDICE DE CANTIDAD NDICE DE PRECIO NDICE DE VALOR
0 100.0 100.0 100.0
1 144.8 125.0 181.0
2 164.0 140.0 229.6
3 92.0 145.0 133.4
Clculo: todos los ndices se calcularon tomando como referencia el perodo
0 (perodo base). En ese sentido los valores de los ndices resultan de:
Periodo 1 2 3
ndices de Cantidad: (181 / 125) x 100 (205 / 125) x100 (115 / 125) x 100
ndices de Precios: (2.5 / 2) x 100 (2.8 / 2) x 100 (2.9 /2) x 100
ndices de Valor: (452.5 / 250) x 100 (574 / 250) x 100 (333.5 / 250) x 100
Como se aprecia, se obtuvieron tres indicadores: uno hace referencia a la
evolucin en cantidad del bien o servicio, otro a la evolucin en precio y otro
a la evolucin en valor.
4.4.1 4.4.1 Seleccin del periodo base Seleccin del periodo base
167
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La seleccin del perodo base, adquiere una gran importancia dado que los
resultados obtenidos tendrn un sentido conceptual respecto de dicho
perodo. Es por ello que debe contar con ciertas caractersticas de
normalidad.
En trminos generales, ello implica que durante el perodo de referencia la
variable cuya evolucin pretenda reflejarse no haya tenido valores de
excepcin por algn motivo como puede ser la puesta en marcha de medidas
de poltica econmica de carcter coyuntural (temporarias), fenmenos
climticos poco frecuentes (sequas, inundaciones), acontecimientos polticos
especiales, etc.
Por ejemplo, si el objetivo consiste en mostrar la evolucin de las cantidades
producidas de un bien o un conjunto de ellos, es conveniente elegir como
perodo de referencia uno en el cual dicha produccin no haya registrado
valores excepcionalmente altos o bajos.
Otra condicin es que la ubicacin temporal no debe estar muy alejada en el
tiempo.
4.4.2 ndices simples
Un ndice simple se obtiene dividiendo cada precio, cantidad o valor de una
serie dada ya sea en perodos anuales, mensuales, etc. por el precio,
cantidad o valor de uno de esos perodos, el cual ha sido tomado como base
o punto de referencia, el resultado de ese cociente se multiplica por cien.
La frmula general es
I = ndice
t = perodo que se analiza
O = perodo base
Xt = precio, cantidad o valor del perodo que se investiga
X0 = precio, cantidad o valor del perodo considerado como base.
A veces, se cambia el smbolo X por el de P, si se refiere a precios o
produccin, y por Q cuando se trata de cantidades. As por ejemplo:
168
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ejercicio 1. Supongamos los precios de un artculo en el perodo 1999 - 2004,
segn la tabla 11.1. Con estos datos, calcular los ndices simples de precios
con base 1999 y luego los ndices simples con base 2002.
Solucin:
Los ndices simples con base fija se calculan de la siguiente manera:

Siendo la base Xo = 2005, se tendr:
Si consideramos, como perodo base al precio de 2002 se tendrn un valor de
Xo= 4000
169
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Observemos que el ndice de precios para 2004 con base 1999 es de 300.
Dicho resultado nos indica que los precios han aumentado en un 200%. Para
la lectura del ndice se requiere que le restemos 100, pues corresponde al
punto de partida o perodo base. En cambio, el ndice para ese mismo ao
de 2004 con base 2002, nos muestra un aumento menor, es decir, apenas
del 50%. Desde el punto de vista matemtico, los dos resultados son
equivalentes, pero en la forma como impresionan al lector, en el aspecto
psicolgico, son diferentes.
El ndice simple tambin se puede calcular sin base fija, diferente al
calculado anteriormente, en este caso cada ndice se obtiene cambiando de
base. Se dice, que en una serie, los ndices son de base variable, cuando a
cada observacin se le divide por el valor de la observacin inmediatamente
anterior, multiplicndolo por 100.
Ejercicio 2. Con los datos de la tabla siguiente, calcular los ndices con base
variable y el respectivo porcentaje de variacin.
Solucin:
Los ndices de base variable se calculan de la siguiente forma:
Debido a que no se tiene informacin del ao
anterior.



170
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Los incrementos o las disminuciones que se presentan para cada perodo se
dan respecto al ao inmediatamente anterior. As por ejemplo, el precio
aument en un 25% para 2004, con respecto al precio de 2003.
Ejercicio 3. En enero de 2004 una fbrica pag un total de $99.200.000.oo a
120 empleados en nmina. En julio del mismo ao, la fbrica tuvo 30
empleados ms en nmina y pag $30.000.000 ms que en enero. Tomando
al mes de enero como base, hallar:
a) El ndice de empleo
b) El ndice del costo de mano de obra.
c) Mediante la igualdad. Precio relativo x cantidad relativa. Qu
interpretacin podra darse al precio relativo en este caso?
Solucin:
a) Nmero ndice de empleo = NIE

Nmero ndice de empleo = NIE
en cantidad relativa sera 1,25. Crecimiento del 25%.
b) Nmero ndice del costo de mano de obra = ICMO = Salarios pagados en julio
Salarios pagados en enero
ndice de costo mano de obra = ICMO

Valor relativo = 1,3024. Crecimiento del 30,24%.
c) Precio relativo =P
171
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Si lo multiplicamos por 100 se tendr que el ndice de precio es de 104,19%.
Es decir, que el ndice de costo medio por empleado aument en un
4,19% para el mes de julio en relacin con el del mes de enero.
4.4.3 ndices eslabonados
El ndice simple, lo mismo que el ponderado, con base variable presenta, la
ventaja en primer lugar, de indicar las variaciones para cada perodo
respecto al anterior, adems se puede transformar en ndices con base fija,
el cual se obtiene, mediante sucesivas multiplicaciones de los relativos para
cada eslabn:
Supongamos que se desea indicar la variacin en el precio de 2004 respecto
al precio de ese artculo en 2001. Supongamos que en la tabla anterior se
tienen nicamente los precios de esos dos perodos, el clculo del ndice
ser:
El mismo resultado se obtiene si tuviramos nicamente los ndices de base
fija, tal como lo presenta la misma tabla. Con dicha informacin se podr
calcular el ndice, en la siguiente forma:
Ahora, si slo se tiene una serie de ndices con base variable, se podrn
encadenar dichos ndices, para obtener el ndice con base fija:
R = es el relativo o sea y sin ser multiplicado por 100. Reemplazando se
tendr:
El encadenamiento anterior lo hemos realizado con ndices simples de base
variable, pero tambin se puede hacer utilizando ndices ponderados con
base variable.
172
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ejercicio 4. Un ndice para 2003 revela un aumento del 20% respecto del ao
anterior. En 2004 alcanz a 174, es decir, presenta un incremento anual del
18%. Calcular los ndices de 2002 y 2003.
Solucin:
ya que el aumento con respecto

del ao anterior fue del 20%.
debido a que el incremento i en ese ao fue del 18%..
Se requiere determinar los . La base en este ejercicio no se
conoce, por lo tanto puede ser considerado cualquier ao.
Si reemplazamos se obtendr que 174 = donde
Para obtener se hace lo mismo que para:
Reemplazando se tiene que 147,45 = x 1,20; siendo:
Ejercicio 5. Existen tres ndices, cuyas cifras son: para 2002 = 107, para
2003 = 108, para 2004 = 104, es decir, que entre 2001 y 2004, el ndice
eslabonado aument en un 19%. Decir si la anterior afirmacin es cierta o
falsa.
Solucin:
173
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
4.4.4 ndices agregativos simples
Son los de mayor aplicacin, especialmente cuando se cuenta con una serie
de precios de un grupo de artculos, dados en unidades de medida
diferentes.
Estos ndices se calculan teniendo en cuenta la suma de los precios,
cantidades o valores de un grupo de artculos para un perodo, dividida por la
suma de los precios, cantidades o valores para ese grupo de artculos en
otro perodo, considerado como base.
Ejercicio 6. Con los datos de la tabla siguiente, calcular el ndice agregativo
de las cantidades que resultaron en mal estado de conservacin, en un
grupo de artculos, comprados en el mes de junio de 1999, respecto a las
cantidades compradas, en mal estado de conservacin, en el mes de mayo
del mismo ao:
Solucin:
174
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Un primer mtodo, consiste en dividir la suma de las cantidades en mal
estado, de los diferentes artculos en el mes de junio, por la suma de las
cantidades en dicho estado de esos mismos artculos para el mes de mayo:
Este procedimiento es poco usual, ya que se realiza sumando las cantidades
de un perodo, dividindola por la suma de las cantidades de otro perodo,
por tal razn el ndice no queda afectado por las variaciones grandes, que
pueden presentarse en uno o varios artculos, de un perodo a otro; de ah
que se requiera utilizar otro mtodo que mejor refleje esa variacin y consiste
en obtener los ndices simples para cada artculo, luego sumarlos y dividirlos
por el nmero de artculos considerados.
El resultado es un poco mayor al obtenido por el mtodo anterior. Este
aumento se debe a la variacin que se presenta en el artculo B durante
ese perodo.
4.4.5 ndices compuestos
Para explicar los ndices compuestos consideraremos como punto de partida
los ndices agregativos simples, utilizados en el anlisis de un grupo de
artculos sin tener en cuenta la importancia que algunos de ellos pueden
presentar en relacin al conjunto. Esa importancia se denomina ponderacin.
Supongamos dos artculos de consumo diario: la leche y la sal. Si cada
unidad de consumo aumenta en $200 (el precio por botella y por kilo), los
gastos familiares se vern ms afectados por el aumento del precio en la
leche que por el de la sal. Si se supone el consumo de dos botellas diarias,
175
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
implica un incremento en el gasto de $400 diarios, o sea $12.000 al mes,
mientras que el consumo de sal, apenas de un kilo al mes, implica un
incremento de $200. Esa importancia que tiene el artculo leche en relacin a
la sal, se denomina ponderacin
Existe gran cantidad de frmulas para calcular ndices ponderados, cuyo
empleo depender de la naturaleza misma del problema. Recomendndose
utilizar aquella frmula que mejor refleje en una forma aproximada, las
variaciones que pueden presentar los precios o cantidades de un grupo de
artculos.
Generalmente en los ndices que brevemente se expondrn, las
ponderaciones son las cantidades o los precios. Cuando se van a calcular los
ndices de precios, en un grupo de artculos, las ponderaciones son las
cantidades, y en el clculo de los ndices de cantidad, las ponderaciones son
los precios. Los ndices ms conocidos y utilizados son los de Laspeyres,
Paasche, Fisher, Keynes, Marshall, Edgeworth, Waish, Drobisch y Sidgwick.
Veremos algunas de estas frmulas y el procedimiento de clculo para
obtener los ndices tanto de precios como de cantidad.
4.4.5.1 ndices de precios
a) ndice de Laspeyres de precios. Puede interpretarse,
como la relacin existente, al comparar los precios actuales de
un grupo de artculos con los precios de esos mismos artculos
considerados en el perodo base, mantenindose constante como
ponderacin las cantidades del perodo base:
Pt, = precio de los artculos en el perodo que se investiga
PO = precio de los artculos en el perodo base
qo = cantidad de artculos en el perodo base
L = ndice de Laspeyres
I = ndice de precios.
b) ndice de Paasche. Se interpreta como la relacin
existente entre los precios actuales de un grupo de
artculos, con los precios de esos mismos artculos en el
perodo base, mantenindose constante las ponderaciones
que corresponden a las cantidades de dichos artculos dadas para el perodo
que se investiga:
Observemos que la diferencia entre las dos frmulas anteriores, radica
nicamente en la base tomada para las ponderaciones, en la primera son las
176
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
qo que se refieren a las cantidades del perodo base y en la segunda, las qt
que corresponden a las cantidades del perodo que se investiga.
c) ndice de Fisher. Es un promedio geomtrico, que se define como la raz
cuadrada del producto del ndice de Laspeyres por el de Paasche:
4.4.5.2 ndices de cantidad
Las frmulas que se dan para el clculo de los ndices de cantidades de
Laspeyres, Paasche y Fisher son muy parecidas a las de los precios, con la
diferencia de que las ponderaciones son los precios.

Se tendr con el clculo de los ndices de Laspeyres y Paasche una
indicacin de las variaciones en las cantidades para un grupo de artculos,
mantenindose constantes los precios tomados como ponderaciones. En el
ndice de Laspeyres las ponderaciones son los precios del perodo base, en
cambio, en el de Paasche, son los precios del perodo que se investiga.
El ndice de Fisher es la raz cuadrada del producto de los ndices
ponderados de cantidad de Laspeyres por el de Paasche.
Ejercicio 7. Con los siguientes datos, referentes a los precios (cientos de $) y
cantidades (en ambos casos se han tomado valores arbitrarios) para un
grupo de artculos dados para dos perodos.
177
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Calcular los ndices de precios y de cantidades, por las frmulas de
Laspeyres, Paasche y Fisher.
Solucin:
a) Clculo de los ndices de precios:
b) Clculo de los ndices de cantidad:
178
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Tambin se puede calcular as:
Ejercicio 8. El ndice de cantidad de un grupo de artculos es igual a 200, si
se usa la frmula de Fisher, y a 160 si se emplea la de Laspeyres. Cul es
el ndice de cantidad utilizando la frmula de Paasche?
Ejercicio 9. Una empresa espera aumentar sus ventas en el ao prximo en
un 50%. En qu porcentaje deber incrementar los precios para que el
ingreso total se convierta en un 250%?
Solucin:
Se sabe que el ndice de ingreso total es igual al ndice de cantidad
vendida por el ndice de precios:
250 = (150) x Ind. Precios
Quiere decir, que se deben aumentar los precios en un 66,67%.
Ejercicio 10. El ndice de precios de Laspeyres es 2/3 del de Paasche y ste
asciende a 130. Cul es el ndice de Fisher?
179
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Solucin:
4.5 Usos de los nmeros ndices
Hemos observado con los ejercicios anteriores, algunas de las aplicaciones
de los nmeros ndices; tal fue el caso al determinar las variaciones que
sufren los precios, cantidades o valores de un conjunto de artculos, o
aplicados en una serie de tiempo, constituida por una sola variable. Sin
embargo, el uso de los nmeros ndices es mucho ms amplio,
especialmente en la actividad econmica. Veamos algunas de las
aplicaciones ms importantes que tienen los nmeros ndices:
Clculo del salario y del ingreso real
Mediante el uso de las siguientes frmulas, se obtienen:
a) Salario real; b) Ingreso real:
Este proceso de convertir el salario y el ingreso nominal en real, se conoce
como deflactacin o sea la transformacin de valores expresados a precios
corrientes en valores precios constantes, con respecto a un perodo.
Ejercicio 11. Supongamos que un empleado en noviembre de 2003 ganaba
un salario de $860.000 y en el mes de junio de 2004, su salario fue
reajustado con un aumento de $124.000. Se sabe adems, que los ndices
de precios al consumidor para los mismos meses y aos son de 1.564,3 y
2.429,4, respectivamente. Se quiere saber si con el reajuste que le hicieron
su salario mejor con relacin al que tena anteriormente.
Solucin:
Lo primero que hacemos es el traslado de la base del ndice de precios al
consumidor (IPC), a 2003 pues ambos tienen la misma base
(supuestamente) en 1988.
180
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Lo anterior quiere decir, que los precios de los artculos de primera
necesidad aumentaron para dicho perodo en un 55,3%, por lo tanto debe
haber un porcentaje igual o mayor de incremento en el salario nominal, para
que las condiciones econmicas sean guales o mejores, para 2004.
El salario real para junio de 2004 ser:
El anterior resultado nos indica que el aumento es demasiado bajo, es decir,
que a pesar de estar recibiendo ms dinero que antes, o sea $984.000, este
salario apenas equivale a $633.612,36 de aquel perodo, cuando estaba
ganando $860.000.oo. El aumento deba haber sido de $475.580, o sea que
su nuevo salario debera ser de $1.335.580, en vez de $984.000.
Ejercicio 12. La depreciacin monetaria, en un pas cualquiera, aumenta cada
ao. Durante el perodo 1998 - 2004, el aumento es de un 10%, respecto al
ao anterior. Corregir la siguiente serie de valores, (miles $), de la
depreciacin monetaria.
Solucin:
181
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Como el ndice se incrementa en un 10% anual, a partir de 1998 se tendrn
los siguientes ndices:
1998 = 100% 2000 = 110 x 1.10 = 121
1999 = 100 x 1.10 =110 2001 = 121 x 1.10 = 133.1
y as sucesivamente
Luego dividimos cada valor por su respectivo ndice obtenindose de esta
manera los valores corregidos.
Poder de compra
Denominado tambin como poder adquisitivo del dinero o valor del dinero.
Se refiere a la relacin existente entre la unidad monetaria y la cantidad de
bienes que se pueden obtener a cambio de ella.
El poder de compra se halla mediante la aplicacin de la siguiente frmula:
y el ndice de poder adquisitivo o de compra:
IO = ndice de precios al consumidor, considerado como perodo de
referencia.
It, = ndice de precios al consumidor, considerado como perodo que
investigamos.
182
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ejercicio 13. En el caso del ejercicio anterior, se consider que el ndice de
precios al consumidor era de 1.564,3 para noviembre de 2003 y de 2.429,4
para junio de 2004. Adems, cuando se hizo el cambio de base, para el mes
de junio de 2004, este ndice era de 155,30. Con esos datos se puede
calcular tanto el poder de compra, como el ndice de poder de compra para
junio respecto a noviembre de 2003.
Solucin
Lo anterior quiere decir, que un peso de noviembre de 2003, para el mes de
junio de 2004 vale 64 centavos. Su valor se ha reducido durante ese perodo
en 36 centavos. El ndice de poder adquisitivo, se podra calcular de dos
maneras diferentes, a saber:
a) Multiplicando el poder de compra por 100 para expresarlo en trminos
porcentuales:
IPA = 0,6439 x 100 = 64,39%
b) Utilizando los ndices de precios al consumidor de los dos perodos
considerados:
Por otra parte, conocindose el ndice de poder adquisitivo, se puede obtener
el salario real. Recordemos, que en ese mismo ejercicio para el cual se
calcul el IPA, el salario nominal para el mes de junio de 2004 fue de
$984.000 y en noviembre, este era de $860.000.oo
SR = SN x IPA = 384.000 (0,6439) = 633.597,6 como se pudo comprobar,
se obtiene, aproximadamente, el mismo resultado. Dar exacto si trabajamos
con todos los decimales.
Porcentaje de des valorizacin
Corresponde a la prdida de poder de compra para un perodo con respecto
a otro considerado como base.
% de desvalorizacin = 100
183
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
De acuerdo con los datos anteriores, el porcentaje de desvalorizacin ha
sido de:
% de desvalorizacin = 100 =
De noviembre de 2003 a junio de 2004, la moneda ha perdido un 35% de su
poder de compra, es decir, ahora necesitamos ms dinero para comprar el
mismo artculo o la misma cantidad, debido al aumento en el precio.
Ejercicio 14. Cuando el I PC sube en un 25%, el ndice de poder adquisitivo
baja en un 20%. Es cierta o falsa la informacin?
Solucin:
= 80 - 100 = -20 es cierto, baj en un 20%
Porcentaje de devaluacin
En primer lugar, indiquemos cmo se obtiene el porcentaje de aumento o de
disminucin en el tipo de cambio.
El tipo de cambio es la cantidad de pesos que debemos dar por un dlar.
Ejercicio 15. En Colombia desde el ao de 1970 hasta 1980 el tipo de
cambio ha sido:
184
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Ejercicio 16. El tipo de cambio de $1.529,80 significa una devaluacin del
peso colombiano en un 37% respecto a qu cotizacin?
Solucin:
ndice de produccin y de productividad
El ndice de produccin se obtiene mediante la aplicacin de la frmula
utilizada para calcular el ndice simple:
185
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
El ndice de productividad se puede calcular de dos formas diferentes:
a) Dividiendo cada ndice de produccin por su respectivo ndice de obreros
y el valor resultante se multiplica por 100:
b) Dividiendo la produccin de cada ao por el nmero de obreros,
obtenindose as la productividad por obrero. Luego cada valor resultante se
divide por uno de la serie considerado base, dando como resultado el ndice
de productividad de cada ao en relacin al perodo base:
Ejercicio 17. Con los siguientes datos, obtener el ndice de produccin y el
de productividad, tomando como base el perodo 1998.
Solucin:
a) El ndice de produccin ser =
186
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ

Ejercicio 18. En 2004 el precio de un cierto bien de consumo aument en un
60% por encima del de 2003, mientras que su produccin disminuy en un
40%. En qu porcentaje aument o disminuy el ndice de valor de dicho
bien en 2004 respecto a 2003?
Solucin
Relacin precios de intercambio (RPI)
187
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
En el comercio exterior se tienen ndices de precios y de cantidad. Los
primeros se denominan ndices de valores unitarios, ya que el de precios (Pt,
P0) se obtiene dividiendo el valor total de la mercanca (importada o
exportada), por su cantidad; los segundos, o sea los ndices de quantum, se
denominan en esa forma por la sencilla razn que siendo la mercanca tan
heterognea, no slo en cuanto a la unidad de medida, sino en cuanto a sus
caractersticas (marca, modelo, tamao, etc.) se debe utilizar una unidad
comn: kilos, la que a su vez es considerada como cantidad.
Se tienen por lo tanto ndices de valores unitarios y de quantum, tanto para
importacin como para exportacin.
La relacin de precios de intercambio, como su nombre lo da a entender, es
un indicador de las variaciones entre los precios de los artculos de
exportacin y los precios de importacin. La frmula para determinar la
relacin de estos precios es la siguiente:
I de valor unitario de exportacin
RPI = x 100
I de valor unitario de importacin
Un ndice de RPI superior a 100, indica una mejora en los trminos de
intercambio, y un ndice inferior, corresponde a un empeoramiento de los
mismos.
Teniendo el RPI se puede determinar la capacidad que tiene un pas para
importar y se obtiene multiplicando el RPI por el relativo del quantum de
exportacin:
Capacidad para importar = RPI (relativo de quantum de X).
Ejercicio 19. Con los datos (arbitrarios) de la siguiente tabla, determinar la
relacin de precios de intercambio y la capacidad para importar, tomando
como base 1998.
188
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Solucin:
a) Primero cambiamos la base 1995 por la de 1998, dividiendo cada ndice
por el primero de la serie:
(/ de valor unitario de exportacin)
(/ de valor unitario de importacin)
(/ de quantum de exportacin)
Y as sucesivamente, se procede en cada una de las (3) tres columnas.
b) La relacin de precios intercambio (RPI) se obtiene dividiendo cada ndice
de valor unitario de exportacin (IVUX) por su respectivo ndice de valor
unitario de importacin (IVUM).
189
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
4.6 Proporciones, porcentajes, razones y tasas
Constantemente estamos hablando de ndices o de indicadores, lo que
puede dar lugar a cierta confusin acerca de trminos tales como: ndices,
proporciones, porcentajes y tasas, as que es conveniente hacer algunas
observaciones.
Los nmeros ndices, tal como se ha visto, relacionan una o ms variables en
un perodo dado (colocado como numerador) con la misma variable o
variables en otro perodo, denominado base (como denominador) y sirven
para indicar las variaciones que presenta una variable en funcin de uno de
sus valores, que se toma como referencia o trmino de comparacin.
Como cada relativo lo multiplicamos por 100, los nmeros ndices son
porcentajes de variacin que presenta cada valor de la variable con respecto
al tomado como referencia. Estos nmeros ndices generalmente son
aplicados en las series cronolgicas.
La razn, la proporcin y la tasa tienen en comn, como los nmeros ndices,
la relacin entre dos valores, el uno como numerador y el otro como
190
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
denominador, siendo el cociente de dividir una cantidad por otra, pero con las
siguientes diferencias:
En la razn, el valor considerado como numerador no debe estar contenido
en el valor correspondiente al denominador, en consecuencia, la razn
puede ser un nmero superior o inferior a la unidad. En el caso de que la
razn se multiplique por 100 se tiene nuevamente un porcentaje.
Supongamos que el nmero de personas que visitan un centro mercantil, en
un da cualquiera, es de 7.000, de las cuales, 4.200 son mujeres y 2.800
hombres. Ahora si dividimos a 4.200 por 2.800 se tendr:
La anterior relacin es una razn por el hecho de que el numerador (4.200)
no est contenido en el denominador (2.800). Este resultado significa que por
cada hombre se tiene mujer y media, en otras palabras por cada 100
hombres, 150 mujeres visitan dicho lugar.
Nos indica que las mujeres frecuentan ese centro mercantil en un 50% ms
que los hombres.
Cuando el valor del numerador est incluido en el denominador, se establece
una proporcin, es decir, el cociente de dividir un sumando cualquiera por su
total. Si tal coeficiente se multiplica por 100 se obtendr un porcentaje,
Con el ejemplo de las 7.000 personas que en un da cualquiera van a un
centro mercantil, se tendr que la proporcin de hombres que lo visitan es:
Esta proporcin nos indica que por cada 100 personas que van a ese centro,
en un da, 40 son hombres y 60 son mujeres.
Ahora, si multiplicamos por 100 se tendr:
191
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Se observar que la proporcin no puede ser menor que O ni mayor que 1.
En trminos porcentuales se dir que es un nmero comprendido entre O y
100.
Ambos casos fueron considerados en la elaboracin de una tabla de
frecuencias y se les denomin frecuencias relativas.
A los porcentajes y a las razones, en numerosas ocasiones, se les denomina
tasas; sin embargo al estudiar los cambios que se operan en una poblacin,
los porcentajes y las razones no son suficientes para analizar completamente
la informacin disponible, siendo necesario recurrir a la elaboracin de tesas.
La palabra tesa se emplea para estudiar una variable en funcin de otra con
al que est relacionada. Estos cocientes se multiplican por 100,1.000, etc.,
para evitar el uso de decimales.
El mismo ejemplo que ha servido para explicar lo que es una razn, una
proporcin o un porcentaje, lo utilizaremos para calcular una tasa:
Con lo cual se quiere indicar que 1,45 por 1.000 de los habitantes de esta
ciudad visitan el centro mercantil.
La tasa especfica es aquella que se basa en algunos subgrupos
homogneos de una poblacin, sin tomar en cuenta la totalidad de la
poblacin.
Con base en el conocimiento de los ndices, las proporciones, las tasas, las
razones, los cocientes, y los porcentajes, se presentarn a continuacin una
serie de indicadores financieros, algunos de ellos de gran utilidad en el
anlisis de un balance.
192
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Object 215
193
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
De acuerdo con esta amplia denominacin, el concepto de TASA tiene
aplicacin como expresin o cuantificacin de riesgo y ha generalizado su
utilizacin constituyndose en un medio de expresin genrico en el campo
de la planificacin y de la evaluacin, aunque en estadstica demogrfica es
uno de los campos en donde con mayor intensidad se usa.
A continuacin se definen e ilustran algunas de las tasas de mayor utilidad.
Tasa bruta de natalidad: Relacin entre el total de nacidos vivos en un
perodo de tiempo (generalmente un ao) y la poblacin en la mitad del
perodo, expresada por mil.
b =
B
N
x 1.000
Donde:
b = Tasa de natalidad
B = El total de nacimientos vivos.
N = El total de poblacin a la mitad del perodo (generalmente comprende el
Clculo de la poblacin a la mitad del perodo).
(Por imperfecciones del registro de nacimientos resulta subvaluada. No todos
los nacimientos ocurridos en el perodo son registrados).
Tasa bruta mortalidad: Es la relacin entre el total de las defunciones en
un perodo dado y la poblacin media del mismo perodo, expresada
por mil.
m =
D
N
x 1.000
194
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
Donde:
m = Tasa de mortalidad
D = Total de defunciones
N = El total de poblacin a mitad de perodo.
195
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(Por imperfecciones de registro de defunciones resulta subvaluada. No
todas las defunciones acaecidas en el perodo son registradas).
Las tasas brutas (natalidad, mortalidad, etc.) permiten comparaciones
someras, aunque muy tiles. Por s solas no permiten el anlisis
completo del fenmeno de la mortalidad o el de natalidad, pero son la
expresin de la importancia relativa de las defunciones y de los
nacimientos en los grupos estudiados y permiten establecer
comparaciones entre perodos. Con todo sirven como expresin de la
situacin demogrfica en un perodo dado.
Tasa anual de Crecimiento natural. Es la diferencia entre la tasa bruta de
natalidad y la tasa bruta de mortalidad

r = b - m
Donde:
r = Tasa anual de crecimiento o crecimiento vegetativo
b = Tasa de natalidad
m = Tasa de mortalidad.
Tasa anual de crecimiento. Esta tasa permite conocer el ritmo anual
supuesto constante, al que ha crecido la poblacin entre dos
momentos dados.
Las frmulas con las cuales se calcula la tasa de crecimiento son de forma
exponencial, correspondiente con la curva que presenta el crecimiento
poblacional
N
1
= N
0
(1+r)
t
N
2
= N
0. e
r t
Usando cualquiera de estas expresiones se puede obtener la tasa de
crecimiento r
En las frmulas anteriores se tiene:
r = Tasa de crecimiento
196
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
t = Tiempo que media entre el momento inicial y el momento final de
observacin
N
1
= Poblacin al final del perodo
N
0
= Poblacin inicial o en el momento cero
e =

Base de los logaritmos naturales.
Mediante manejo algebraico las dos expresiones anteriores se transforman
en:
r = antilog
log
1
0
1
N
N
t

r =
ln
1
0
N
N
t
Ejemplo: El clculo de la tasa de crecimiento intercensal de acuerdo con los
censos de poblacin colombiana en los aos 1951, 1964 y 1973 se
realiza de la siguiente manera :
Fecha del censo Nmero de Habitantes Perodo intercensal
Mayo 9 de 1.951 11.548.172
Julio 15 de 1.964 17.484.508 13 aos y 66 das
Octubre 24 de 1.973 22.915.229 9 aos y 99 das

Frmula 1: Tasa de crecimiento para el perodo de 1.951 - 1.964
N
1
= 17.484.508
N
0
=11.548.172
t = 13,18 AOS (66/360 = 0.18)
197
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
r = antilog
log(
. .
. .
)
,
17 484 548
11548172
1318
1

1
]
1
1
1


r = antilog (0.013668) - 1
r = 1.03197 - 1
r = 0.03197 = 31.97%
Tasa de crecimiento por mil habitantes. Es decir, que la poblacin
colombiana aument en 32 personas por cada mil durante el perodo
de 1951 -1964.
Frmula 2: Tasa de crecimiento para el perodo 1964 - 1973
N
1
= 22.915.229
N
0
= 17.484.508
t = 9.275 aos ( 99/360 = 0,275 )
r =
ln
. .
. .
,
. .
22 915229
17 484 508
9 275
0 029163 2916%

Tasa de crecimiento por mil habitantes. Lo que equivale a decir, que la
poblacin colombiana aumento en 29 personas por cada mil durante
el perodo 1964 - 1973.

Una frmula alternativa para calcular la tasa de crecimiento (r) es la
siguiente:
r =
2 1
1 0
1 0
( )
. .
N N
N N
t
k

+
Tasa de Mortalidad Infantil.
198
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
T.M. I. =
0 D
B
x 1.000
Donde:
T.M.I : Tasa de mortalidad infantil
D
0
: Nmero de muertos menores de un ao en un perodo de referencia,
generalmente un ao.
B : Total de nacidos vivos en el perodo de referencia.
Este es uno de los indicadores que mejor resumen las condiciones y la
calidad de vida de una sociedad. Su confiabilidad est directamente
relacionada con la calidad y caractersticas del sistema del registro.
Por ejemplo, un registro tardo del nacido vivo, conduce a sobrestimar
la tasa, supuesto un registro completo de las defunciones; una
imperfeccin en el registro de defunciones conduce a subestimar el
valor de la tasa, supuesta buena calidad en el registro de los nacidos
vivos.
Tasa de mortalidad por edad
M
x
=
X
X
D
N
x 1.000
Donde:
m
x
= Tasa de mortalidad para la edad x ( grupo de edad )
D
x
= Defunciones ocurridas en personas de edad X (grupo de edad)
durante el perodo de referencia.
N
x
= Total de poblacin en edad X (grupo de edad) en el centro del
Perodo de referencia (generalmente en la mitad del ao).
199
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
La tasa as definida tiene por virtud describir las diferenciales de la
mortalidad por edad, que de otra forma se esconden en la estructura
por edad de la poblacin. As, se puede definir tasas de mortalidad
para poblacin joven ( por ejemplo para menores de 15 aos ), para
poblacin adulta ( por ejemplo entre 15 y 60 aos ) y para poblacin
vieja ( mayores de 60 aos ).
Tasa de fecundidad por edad.
F
x
=
X
X
B
Nf
x 1.000
Donde:
F
x
= Tasa de fecundidad de mujeres en edad X (grupo de edad)
B
x
= Total de nacidos vivos en mujeres de edad X durante el perodo de
referencia, generalmente un ao.
NF
x
= Poblacin femenina de edad X (grupo de edad) en la mitad del
perodo de referencia.
Este indicador tambin describe la diferencia que existe en el proceso
reproductivo segn la edad de las mujeres.
Tasas de participacin por sexo y edad.
A
x
=
X
X
NA
N
Donde:
A
x
= Tasa de actividad correspondiente a una edad X.
NA
x
= Poblacin Econmicamente Activa para la poblacin de edad X.
N
x
= Poblacin total de edad X.
200
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
(Los elementos pueden referirse a hombres o mujeres en forma
independiente).
Este indicador pone de manifiesto la variacin significativa que ocurre por
sexo y edad en la participacin econmica. Existe edades en la que la
tasa de participacin de los hombres se acerca al 100 por ciento, en
tanto que la de las mujeres puede ser muy prximo a cero, entre otras
atribuibles a los diversos niveles de desarrollo. La participacin por
zona geogrfica es diferencial por sexo. As en zonas rurales la
participacin de las mujeres es mnima en tanto que la de los hombres
es considerada plena.
BIBLIOGRAFA
1. WYNE.DANIEL, BIOESTADISTICA BASE PARA EL ANALISIS DE LAS CIENCIAS DE LA
SALUD. LIMUSA.MEXICO 1983
2. SNEDECOR GEORGEW.YG.COCHERAN, METODOS ESTADISTICOS ,CONTINENTAL S.A
MEXICO 1971.
3. MOOD ALEXANDER M. GRAYBILL FRANKLIN A Y BOES DUANE C. INTRODUCTION TO
THEORY OF STATISCS. THIRD EDITTION MC GRAW-HILL 1974
4. CONOVER W. J. PRACTICAL NONPARAMETRIC STATICS JHON WILE Y SONS INC.
NEW YORK. 1971
5. CONOVOS GEORGE C. PROBABILIDAD Y ESTADISTICA APLICACIONES Y METODOS
MC.GRAW.HILL MEXICO 1988.
6. CHAO LINCOLN L. ESTADISTICA PARA LAS CIENCIAS ADMINISTRATIVAS 2 EDICION
MC GRAWL HILL. 1975.

7 WALPOLE RONALD E. RAYMOND H. MYERS.PROBABILIDAD Y ESTADISTICA
4 EDICION MCGRAWL-HILL MEXICO 1992.
201
MODULO DE ESTADSTICA II - ALBERTO QUINTO JIMNEZ
8. LEVIN RICHARD Y. ESTADISTICA PARA ADMINISTRADORES 2 EDICION PRENTICE.
HALL HISPANOAMERICANA S.A MEXICO 1988.
9. BOROVKOV A. A ESTADISTICA MATEMATICA MIR MOSCU 1984.
10. SIEGEL SEDNEY ESTADISTICA NO PARAMETRICA, APLICADA A LAS CIENCIAS DE LA
CONDUCTA TRILLAS, MEXICO 1989
202

También podría gustarte