Está en la página 1de 108

MDULO DE ESTADSTICA BSICA Y

PROBABILIDADES

JUAN ARTEAGA CRAWFORD


LICENCIADO EN MATEMTICAS Y FSICA, UNIVERSIDAD DE CRDOBA
INGENIERO MECNICO, UIS.

CONTENIDO
PRLOGO
UNIDAD I CONCEPTOS GENERALES.
1.
2.
3.
4.

5.

6.

7.

INTRODUCCIN.
DEFINICIN DE ESTADSTICA.
IMPORTANCIA DEL ESTUDIO DE LA ESTADSTICA.
TIPOS DE ESTADSTICA.
Estadstica descriptiva.
4.1.
4.2.
Estadstica Inferencial.
4.3.
Poblacin.
4.4.
Muestra.
TIPOS DE VARIABLES.
5.1.
Variable Cualitativa.
5.2.
Variable Cuantitativa.
5.2.1. Variable cuantitativa discreta
5.2.2. Variable cuantitativa continua
DATOS ESTADSTICOS.
6.1.
Datos de nivel nominal
Datos de nivel ordinal.
6.2.
6.3.
Datos de nivel de intervalo
6.4.
Datos de nivel de razn.
EJERCICIOS DE LA UNIDAD.

UNIDAD II ESTADSTICA DESCRIPTIVA.


1.
2.

3.
4.

5.

INTRODUCCIN
DISTRIBUCIONES DE FRECUENCIA.
2.1.
Definicin.
2.2.
Elaboracin.
2.3.
Propiedades de las distribuciones de frecuencia.
REPRESENTACIONES TALLO Y HOJA.
REPRESENTACIONES GRFICAS DE UNA DISTRIBUCIN DE
FRECUENCIAS.
4.1.
Histograma.
4.2.
Polgono de frecuencias.
4.3.
Distribuciones de frecuencias acumuladas
4.4.
Diagramas circulares.
EJERCICIOS DE LA UNIDAD.

UNIDAD III MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE


DISPERSIN.
1.
2.

3.
4.
5.
6.

7.

8.

9.

INTRODUCCIN.
MEDIA ARITMTICA.
2.1.
Media poblacional.
2.2.
Media muestral.
2.3.
Propiedades de la media aritmtica
MEDIA PONDERADA.
MEDIANA.
4.1.
Propiedades de la mediana.
MODA.
MEDIA GEOMTRICA.
6.1.
Aumento porcentual promedio en un perodo
determinado.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS.
7.1.
Media.
Mediana.
7.2.
7.3.
Moda.
MEDIDAS DE DISPERSIN.
Amplitud o intervalo de variacin.
8.1.
8.2.
Desviacin media
8.3.
Varianza
8.4.
Desviacin estndar.
8.5.
Medidas de dispersin para datos agrupados.
8.5.1. Amplitud de variacin.
8.5.2. Desviacin estndar.
8.6.
Deciles, cuartiles y centiles.
8.7.
Interpretacin y usos de la desviacin estndar.
8.7.1. Teorema de Chebyshev.
8.7.2. Regla emprica.
8.8.
Dispersin relativa.
EJERCICIOS DE LA UNIDAD.

UNIDAD IV. PROBABILIDADES.


1.
2.

3.

INTRODUCCIN.
DEFINICIONES PREVIAS.
2.1.
Experimento.
2.2.
Evento.
2.2.1. Eventos mutuamente excluyentes
2.3.
Espacio muestral.
DEFINICIN DE PROBABILIDAD DE UN EVENTO.

4.

5.

6.
7.
8.
9.

10.

PUNTOS DE VISTA DE LA PROBABILIDAD.


4.1.
Probabilidad objetiva
4.1.1. Probabilidad Clsica.
4.1.2. Probabilidad emprica.
4.2.
Probabilidad subjetiva.
REGLAS DE PROBABILIDAD.
5.1.
Regla de la adicin.
5.2.
Regla de la Multiplicacin
5.3.
Regla del complemento
DIAGRAMAS DE RBOL.
REGLA DE LA PROBABILIDAD TOTAL.
TEOREMA DE BAYES.
PRINCIPIOS DE CONTEO.
9.1.
Principio aditivo de conteo.
9.2.
Principio multiplicativo de conteo.
9.3.
Permutaciones.
9.4.
Combinaciones.
EJERCICIOS DE LA UNIDAD.

UNIDAD V. DISTRIBUCIONES DE PROBABILIDAD.


1.
2.
3.
4.

5.

INTRODUCCIN.
DEFINICIN.
VARIABLE ALEATORIA.
DISTRIBUCIN DE PROBABILIDAD DISCRETA.
4.1.
Funcin de distribucin acumulativa
4.2.
Media, varianza y desviacin estndar de una
distribucin de probabilidades discreta.
4.3.
La distribucin binomial.
4.3.1.
Media de una distribucin de probabilidad
binomial.
4.3.2.
Desviacin estndar de una distribucin de
probabilidad binomial.
4.3.3.
Uso de tablas en la distribucin binomial.
4.4.
La distribucin de Poisson
4.4.1.
Media de una distribucin de probabilidad de
Poisson.
4.4.2.
Desviacin estndar de una distribucin de
probabilidad de Poisson.
4.4.3.
Uso de tablas en la distribucin de Poisson
DISTRIBUCIN DE PROBABILIDAD CONTINUA.
5.1.
Funcin de distribucin acumulativa
5.2.
Media, varianza y desviacin estndar de una
distribucin de probabilidades continua

La distribucin normal.
5.3.1.
Distribucin normal estndar
5.3.2.
Clculo de probabilidades.
5.3.3.
Uso de la tabla de la distribucin normal
estndar.
6.
EJERCICIOS DE LA UNIDAD.
TABLAS
5.3.

PRLOGO
Este mdulo es el fruto de mi travesa por la estadstica. El contenido
est dirigido principalmente a los estudiantes del programa de
educacin a distancia de la Universitaria de Investigacin y Desarrollo
UDI y su principal objeto es aproximar el conocimiento de la estadstica
al conjunto de todos ellos.
La experiencia propia en cursos de estadstica muestra que la mayora
de los estudiantes ven a esta materia como un proceso de aplicacin de
frmulas sin sentido y que slo sirve de relleno, descuidando el enorme
poder que hay en ella principalmente si se adapta a situaciones
cotidianas y si se interpretan y analizan casos, especialmente desde la
estadstica inferencial.
La redaccin de este mdulo se da en un lenguaje propio y es el mismo
que utilizo en el aula de clases. Los temas que se explican se muestran
de una manera concisa, un tanto reiterativa cuidndome de no rayar en
la redundancia.
Este mdulo no es un tratado de la estadstica, pero si muestra el
sendero para que el estudiante con las ideas bsicas profundice en libros
un poco ms detallados, por tanto se espera que lo que aqu se escriba
se contraponga con las ideas de textos de estadstica y en lo posible se
complemente.
Muchos de los clculos que se hacen a mano se pueden facilitar si se
conocen las funciones de las calculadoras cientficas digitales o si se
manejan, en lo ms mnimo, hojas de clculo como Excel; por ello invito
al docente de la materia a que incentive en los estudiantes la utilizacin
de estas herramientas.
Al final del mdulo se anexan tablas de distribuciones binomiales, de
Poisson y normal estndar para que el estudiante disponga de ellas al
momento de resolver problemas.
Por ltimo, agradezco a la Universitaria de Investigacin y Desarrollo
permitirme producir este mdulo.
Para cualquier comentario, opinin o sugerencia le agradecer enviarlo
al correo juacrar@yahoo.com.
Juan Arteaga Crawford
Bucaramanga, Junio de 2005.

UNIDAD I. CONCEPTOS GENERALES.


OBJETIVO GENERAL.
Comprender el concepto de estadstica y la importancia de su estudio.
OBJETIVOS ESPECFICOS.

Definir el concepto de estadstica.


Explicar la diferencia entre la estadstica descriptiva y la estadstica
inferencial.
Diferenciar claramente los conceptos de poblacin y muestra.
Explicar cuando una variable es cualitativa y cuando es cuantitativa.
Distinguir entre variable discreta y variable continua.
Diferenciar entre todos los niveles de los datos estadsticos.

1. INTRODUCCIN.
En muchos momentos de nuestras vidas necesitamos tomar decisiones,
para hacerlo dirigimos los sentidos necesarios a fin de recolectar
informacin. Por ejemplo, si queremos tomar agua fra, vamos a la
nevera, sacamos el agua y palpamos el recipiente que la contiene. De
acuerdo a lo que diga nuestro sentido del tacto decidiremos si tomamos
o no el agua. Es de apreciar que en el ejemplo se est tomando una
decisin basado en una muestra. Las empresas, el gobierno, los seres
humanos y hasta los animales enfrentan situaciones similares, es por
ello que se deben acudir a muestras para tomar decisiones.
Al entender esto, el hombre se ha encaminado a contar, medir, cualificar
y cuantificar todo lo que le rodea bien sea en forma tcnica o
inconsciente, para despus responder preguntas tales como: cundo?,
cunto?, con qu regularidad?, qu tan rpido?, con qu calidad?,
qu tan grande?, qu tan lejos?, todas ellas referentes a las
experiencias vividas.
Cuando se hace todo lo anterior, se contribuye a que en futuras
experiencias se acte de manera ms eficiente. Es en este momento
cuando toma gran importancia el concepto de tratamiento y
manipulacin de datos, que es fundamentalmente de lo que trata la
estadstica.

2. DEFINICIN DE ESTADSTICA.
Es la ciencia que utiliza una serie de teoras, mtodos y tcnicas
especializadas para recolectar, organizar, ordenar, tabular, presentar
grficamente, describir, analizar e interpretar datos con el objeto de
extraer de ellos conclusiones tiles para ayudar decisiones efectivas.
3. IMPORTANCIA DEL ESTUDIO DE LA ESTADSTICA.
Generalmente los estudiantes al iniciar sus estudios en esta materia se
preguntan por qu debo estudiar estadstica?. La respuesta ms simple
es que en todas las reas de desempeo profesional hay que tomar
decisiones. En realidad, la mayora de las personas que toman
decisiones, en una empresa por ejemplo, no efectan una anlisis
estadstico, pues esta operacin le corresponde a personas
especializadas en la estadstica; pero hay que tener un nivel mnimo de
conocimientos estadsticos, necesarios, para comprender perfectamente
dichos anlisis. La necesidad de tales conocimientos no se limita a la
persona que en ltimas decide. Todos deben estar al tanto de las
tcnicas actuales de esta ciencia. Se puede, entonces, identificar tres
razones por las cuales se debe estudiar estadstica:

En todos los campos del conocimiento y desempeo profesional se


encuentra informacin numrica.
Las tcnicas estadsticas se utilizan para tomar decisiones que
influyen en la vida cotidiana.
Se hace necesario conocer por qu se toman ciertas decisiones, para
aportar una mejor comprensin respecto a la forma en que ellas
afectan.

Para poder tomar una decisin es necesario:

Determinar si la informacin con la que se cuenta es la adecuada o si


se necesita ms.
Tener la capacidad para reunir la informacin adicional, si esta fuera
necesaria.
Resumir toda la informacin de manera eficiente.
Analizar la informacin disponible.
Sacar conclusiones y realizar inferencias y estar evaluando para
saber si se llega a una conclusin incorrecta.

4. TIPOS DE ESTADSTICA.
El estudio de la estadstica se divide en dos ramas: Estadstica
descriptiva y Estadstica inferencial.
4.1. Estadstica
descriptiva.
Comprende
primordialmente
la
recoleccin, recopilacin, ordenamiento, organizacin, tabulacin,
presentacin, tratamiento matemtico, y anlisis de datos con el objeto
de presentarlos de manera informativa. Lo que se hace en este tipo de
estadstica es suministrar una informacin de manera detallada, de tal
manera que lo que se quiere describir sea de fcil interpretacin y
anlisis.
4.2. Estadstica Inferencial. Tambin conocida como inferencia
estadstica o estadstica inductiva. Para comprender mejor el objeto de
estudio de esta rama es necesario definir los conceptos de poblacin y
muestra.
4.2.1.
Poblacin. Es el conjunto de todos los posibles individuos,
objetos o medidas que poseen caractersticas comunes y que son de
inters para su estudio. Ejemplos de poblacin pueden ser: Los
estudiantes que estudian en la UDI, Los libros de la biblioteca, Las
estaturas de todos los jugadores de la seleccin colombiana de ftbol.
4.2.2.
Muestra. Es una porcin o parte de la poblacin de inters.
Dentro de las razones por las cuales, en muchas ocasiones, se toma una
muestra en lugar de toda la poblacin estn:

Por razones econmicas. Por ejemplo si se desea cul es la


predileccin de la ciudadana sobre cierto candidato a la presidencia,
sera muy costoso indagar a los 45 millones de habitantes que hay en el
pas, es por eso que se toma una muestra representativa de la
poblacin.

Por
la
necesidad
de hacer
pruebas destructivas.
Generalmente las pruebas de control de calidad son destructivas, por
ejemplo, cuando se quiere medir la resistencia al impacto de los codos
de PVC, estos se dejan caer desde cierta altura de tal manera que al
golpear contra el suelo sufren avera. No se puede tomar toda la
poblacin de codos porque eso implica un gasto total de la produccin y
por ende la no venta de ellos.

Por imposibilidad de tomar toda la poblacin. Sera imposible


que unos bilogos marinos capturaran, marcaran y contaran todos los
peces sierra que hay en el mar caribe colombiano, por tanto una

muestra de estos peces ayudara a inferir sobre cualquier estudio que se


haga de esta poblacin.

Lo adecuado de los resultados de la muestra. Hay precios de


productos que varan muy poco de un supermercado a otro, entonces
sera innecesario comparar todos los supermercados del pas para
conocer el ndice de variacin de precios. Con una muestra sera
suficiente.

Por el tiempo disponible para el estudio de una poblacin.


En ocasiones no se dispone de todo el tiempo para, por ejemplo,
entrevistar a todas las personas de una poblacin. Al tomar una muestra
se reduce el tiempo de recoleccin de datos.
En este punto ya se puede definir estadstica inferencial. Esta consiste
en el conjunto de mtodos utilizados para el anlisis e interpretacin de
una muestra de datos para saber algo acerca de una poblacin.
5. TIPOS DE VARIABLES.
Si una caracterstica sobre la cual se concentra el inters puede tomar
distintos resultados o valores o tiene diferentes resultados se le llama
variable. Existen dos tipos bsicos de variables: variable cualitativa y
variable cuantitativa, esta ltima puede ser, a su vez, continua o
discreta.
5.1. Variable Cualitativa. Cuando la variable en estudio es no
numrica, por ejemplo, el gnero sexual, la religin, el lugar de
nacimiento, la preferencia de una marca, las profesiones elegidas, la
clase de empaque, el color de los ojos, entre otras. A los datos
correspondientes a variables cualitativas, se deben convertir a valores
numricos, para poder aplicar los diversos mtodos estadsticos y
someterlos a anlisis.
5.2. Variable Cuantitativa. Si los posibles resultados de una variable
pueden expresarse numricamente, por ejemplo, el peso de los
estudiantes, el saldo de una cuenta, la edad, los kilmetros recorridos
por un auto.

5.2.1. Variable cuantitativa discreta. Es aquella que puede asumir


ciertos valores que estn separados. Por ejemplo, el nmero de hijos de
una familia, la cantidad de estudiantes de un saln de clases, las
paradas de un autobs, la cantidad de autos que pasan por una esquina.

Hay que ver que una familia puede tener 0, 1, 2, 3, 4, hijos pero
nunca 2.5 hijos ni 3.2345 hijos. Es decir entre el nmero 3 de hijos y el
nmero 4 de hijos hay un salto o espacio, que es lo que caracteriza a
una variable de tipo discreta.
5.2.2. Variable cuantitativa continua. Es aquella que puede tomar
cualquier valor dentro de un intervalo determinado. Por ejemplo, la
velocidad de un proyectil, la temperatura de un cuerpo, la presin del
aire dentro de una llanta que se desinfla, el tiempo de viaje de una
ciudad a otra.
Es de notar que, por ejemplo, la presin en una llanta que se desinfla
puede tomar valores de 500 psi y 450 psi; pero tambin puede tomar
los valores de 510, 501, 500.01, 500.00001, 500.00000001 psi. Es decir
no hay saltos entre un valor de la presin y su siguiente, su variacin es
continua.
En la figura 1 se representa esquemticamente los conceptos de
variable discreta y continua.

Figura 1. Diagrama esquemtico de las variables discreta y continua.

La clasificacin de los tipos de variables se muestra en forma resumida


en la figura 2.

Figura 2. Diagrama resumen de los tipos de variables estadsticas.

6. DATOS ESTADSTICOS.
Los datos pueden clasificarse de acuerdo a los niveles de medicin. El
nivel de medicin de un dato determina los clculos que se pueden
realizar para resumir y presentar la informacin. Los datos pueden ser
de cuatro niveles: datos de nivel nominal, datos de nivel ordinal, datos
de nivel de intervalo y datos de nivel de razn o cociente.
6.1. Datos de nivel nominal. Son los datos que slo se pueden
contar o clasificar. No existe escala entre ellos. Por ejemplo, se tienen 4
lapiceros de distintos colores de tinta: rojo, azul, negro y verde. Se
pueden clasificar los lapiceros segn su color y no hay un orden entre
ellos, es decir si se quiere hacer una organizacin de ellos, primero se
puede reportar el verde, luego el azul, luego el rojo y por ltimo el
negro, o en cualquier otro orden. Slo es nombramiento de los datos
ms no hay categorizacin entre ellos.
6.2. Datos de nivel ordinal. Son datos que se diferencian
jerrquicamente aunque no es posible hacer diferencia en magnitud
entre ellos. Por ejemplo, si se pide que se califique el desempeo del
profesor de estadstica, los resultados pueden ser: Malo, Regular, Bueno
o Excelente. Se nota que Excelente es mejor que bueno, bueno es mejor
que regular y regular es mejor que malo, es decir, existe jerarqua entre
los datos; pero lo que si no se puede decir es que 2 buenos equivale a 1
excelente, tampoco que la magnitud entre bueno y regular es la
misma entre bueno y excelente.
6.3. Datos de nivel de intervalo. Son datos que se diferencian en
escala y la diferencia entre sus valores tiene una magnitud con un
significado. En esta clase de datos, el cero no representa la ausencia de
la propiedad que se mide, es slo una valor en una escala determinada.
Por ejemplo, supongamos que la temperatura en un da en
Bucaramanga es de 20 C, 23 C, 26 C y 29 C. Estos son datos de
nivel de intervalo, pues la magnitud entre el valor 26 C y el valor 20 C
tiene un significado, la diferencia de temperaturas. El valor de
temperatura de 0 C no significa que no haya temperatura, significa que
es el comienzo de una escala, en este caso la escala Celsius.
6.4. Datos de nivel de razn. Este es el nivel ms alto. Los datos
estn organizados en escala, el punto 0 tiene el significado de ausencia
de la propiedad que se mide y la razn (o cociente) entre dos valores es
significativa. Por ejemplo, el salario de una persona que trabaja en un
banco es de $800.000 y el de un comerciante es 1200.000, el cociente

1'200.000
= 1.5 , lo que significa que el comerciante gana
800.000
1.5 veces ms que el empleado de bancos. Note que tener un salario de
$0, significa que no se tiene salario.

entre ellos es de

La figura 3 muestra un resumen de los tipos de datos que existen.

Figura 3. Diagrama resumen de los niveles de los datos estadsticos.

7. EJERCICIOS DE LA UNIDAD.
7.1. Clasifique la siguientes variables:

Preferencias polticas (izquierda, derecha o centro).


Marcas de cerveza.
Velocidad en Km/h.
El peso en Kg.
Signo del zodiaco.
Nivel educativo (primario secundario, superior).
Aos de estudios completados.
Tipo de enseanza (privada o pblica).
Nmero de empleados de una empresa.
La temperatura de un enfermo en grados Celsius.
La clase social (baja, media o alta).
La presin de un neumtico en Pa

7.2. Clasifique las variables que aparecen en el siguiente cuestionario.

Cul es su edad?
Cul es su estado civil?
Cuanto tiempo emplea para desplazarse a su trabajo?
Cuntos habitantes tiene su municipio de residencia?
Est afiliado a la seguridad social?

7.3. Clasifique los datos:

Juan es mecnico.
Mara termin el bachillerato.
Juan tiene 30 dientes.
Mara tiene 65 pulsaciones por minuto.

7.4. D un ejemplo de variable cualitativa.


7.5. D un ejemplo de variable cuantitativa continua y uno de variable
cuantitativa discreta.
7.6. Explique con sus propias palabras la diferencia entre continuo y
discreto.
7.7. Por qu a veces es necesario tomar muestras en vez de toda la
poblacin?
7.8. De qu trata la estadstica descriptiva?
7.9. De qu trata la estadstica inferencial?
7.10. Si usted quisiera entrar en el mercado con un nuevo producto y
quisiera conocer la opinin de la gente acerca de su producto, en
qu clase de estadstica se apoyara? Explique. Suponga ahora que
quisiera tomar una decisin acerca del mercadeo se apoyara en
el mismo tipo de estadstica? por qu?
7.11. Defina en sus propias palabras el concepto de estadstica.
7.12. Por qu es importante estudiar estadstica?

UNIDAD II ESTADSTICA DESCRIPTIVA.


OBJETIVO GENERAL.
Aprender a utilizar los mtodos ms comunes para la organizacin y
presentacin de datos que sern la base para un anlisis posterior de
resultados.
OBJETIVOS ESPECFICOS.

Analizar la conveniencia que tiene un investigador de organizar y


presentar datos en cuadros , diagramas, tablas y distribuciones de
frecuencia.
Organizar datos en una distribucin de frecuencias.
Presentar una distribucin de frecuencias en un histograma, un
polgono de frecuencias y un polgono de frecuencia acumuladas.
Elaborar e interpretar una representacin de tallo y hoja.
Utilizar adecuadamente grficas de barras, lneas y crculos.

1. INTRODUCCIN.
Muchas veces se dispone de una cantidad muy grande de datos que
para poder analizarlos se hace necesario organizarlos. Tal anlisis puede
consistir en saber dnde se agrupan la mayor cantidad de dichos datos o
cmo varan para poder detectar cualquier tendencia. La organizacin de
datos puede hacerse mediante grficas, diagramas y tablas que sean de
fcil entendimiento y manejo. En esta unidad se ver las tcnicas para
construir estas formas de presentacin.
2. DISTRIBUCIONES DE FRECUENCIA.
2.1 Definicin. Es un mtodo de clasificacin y agrupamiento de datos
estadsticos en clases o intervalos, de tal manera que se pueda
establecer el nmero o porcentaje de cada clase y as manipularlos en
grandes cantidades. El nmero o porcentaje de cada clase se le conoce
como frecuencia de clase. Por ejemplo, la tabla 1 muestra una
distribucin de frecuencias de las estaturas de una poblacin de
jvenes. Las clases son los intervalos de estatura.
Loas frecuencias relativas se calculan respecto al nmero total, as
200/650=0.3076 es la frecuencia relativa de la primera clase.

Estatura (m)

Frecuencia

Frecuencia relativa

1 1.25
1.25 1.5
1.5 1.75
1.75 2
Total

200
250
120
80
650

0.3076
0.4167
0.1846
0.1231
1.00

30.76
41.67
18.46
12.31
100

Tabla 1. Distribucin de frecuencias para las estaturas de los jvenes.

Esta distribucin muestra que la mayora de los estudiantes (250) tienen


estaturas entre 1.25 metros y 1.5 metros, es decir que los datos se
concentran en esta clase.
Cuando se va a construir una distribucin de frecuencias hay que definir
cuntos intervalos o clases se van a utilizar as como la amplitud de
cada uno. Existen ciertos lineamientos flexibles que se pueden seguir.
2.2 Elaboracin. Se tomar un ejemplo para explicar los pasos de la
elaboracin.
Ejemplo 1. En una fiesta de estudiantes de un colegio de bachillerato,
asistieron 180 jvenes. A cada uno se les pregunt la edad y sus
respuestas se anotaron en la tabla 2.
12 18 22 25 31
21 22 14 21 17
18 12 19 12 19
17 18 16 14 15
13 14 15 20 17
18 17 20 12 21
26 23 25 31 21
15 18 17 18 29
16 20 12 16 22
18 15 20 19 12
13 18 14 15 18
17 14 19 20 16
19 17 16 17 15
15 18 18 13 24
19 13 23 24 17
23 21 15 14 19
17 23 21 18 23
19 15 17 24 15
Tabla 2. Edades de los jvenes que
bachillerato.

28 18 26 24 16
18 14 18 13 21
25 17 22 17 20
17 18 19 15 18
12 22 13 19 16
29 15 21 27 27
14 19 31 21 15
18 25 22 18 27
12 19 14 21 20
17 15 18 17 16
20 19 16 13 22
24 13 17 20 15
24 17 21 16 22
21 20 22 26 17
19 13 17 19 30
30 19 24 25 19
22 30 18 14 24
19 26 19 28 19
asistieron a la fiesta del colegio de

Solucin.
La informacin que muestra la tabla 2 est muy desorganizada y el
objetivo es ordenarla de tal manera que su anlisis sea ms fcil.
Paso 1. Determinar el nmero de clases. Para el caso, las clases se
refieren a los intervalos de edades. Demasiadas clases o muy pocas
pueden no revelar la forma bsica del conjunto de datos. Se recomienda
que el lmite inferior de la primera clase sea un poco menor que el valor
ms pequeo del conjunto de datos, para el ejemplo, menor que 12.
Adems que el lmite superior de la ltima clase sea un poco mayor que
el valor ms grande del conjunto de datos, que para el ejemplo es 31.
En general para grandes cantidades de datos se requieren ms clases
que para pequeas cantidades. Por lo general se agrupan de 5 a 15
clases. Se toman 7 clases para el ejemplo.
La frmula que a continuacin se nombra permite calcular el nmero de
clases:
n Si n no es muy grande
N de int ervalos = K =
1 + 3.22 Log en otro caso
Pero en general, la eleccin de las clases depende del criterio del
investigador. Es decir se debe tomar un nmero de clases que no sea
muy grande y que no se muy pequeo.
Paso 2. Determinar la amplitud de clase o intervalo de clase. Se
debe tomar el intervalo igual para todas las clases, sin embargo hay
ocasiones en que se pueden tomar amplitudes de clases desiguales para
evitar clases vacas o casi vacas. Del nmero de datos se busca el valor
ms alto (A) y el valor ms bajo (B) y el intervalo se halla por medio de
la frmula:
I=

A B
K

Donde K es el nmero de clases elegido.


Para el ejemplo, A = 31, B = 12 y K = 7 , por tanto I =

31 12
= 2.375 . Este
7

valor se redondea al entero superior, as que I = 3 .


Paso 3. Creacin de las clases. Las clases que se formaron se
muestran en la tabla 3.

Clases
Edades (Aos)
11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total
Tabla 3. Clases formadas para el ejemplo 1.

El lmite superior de cada clase corresponde al intervalo siguiente, por


ejemplo, en la clase 11 14, el 14 pertenece ala clase 14 17 y en la
clase 23 26, el 26 pertenece a la clase 26 29. para ser ms
estrictos, en trminos matemticos, cada clase sera un intervalo
semiabierto a la derecha, es decir, la clase 14 17 sera el intervalo
[14,17 ) donde entran todos los valores desde el 14 hasta el 17, excepto el
17.
Paso 4. Contar el nmero de elementos de cada clase. Hay que
recordar que el nmero de observaciones de cada clase se le llama
frecuencia de clase, por ejemplo hay 17 alumnos que tienen edades
entre 11 y 14 aos, luego 17 es la frecuencia de la clase 11 14. El
conteo se puede hacer manual como se muestra en la tabla 4 o
utilizando la funcin CONTAR.SI de la hoja de clculo Excel. Las
frecuencias asociadas a cada clase se simbolizan f i y las frecuencias
relativas hi .

Edades
11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total

frecuencia
///// ///// ///// //

= 17

///// ///// ///// ///// ///// ///// /////

= 35

///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// /
///// ///// ///// ///// ///// ///// //

= 61

= 32

= 18
///// //// = 9
///// /// = 8
180

///// ///// ///// ///

Tabla 4. Conteo manual de los estudiantes que pertenecen a cada clase en


particular para el ejemplo 1.


Punto medio de clase. Tambin conocida como marca de clase,
se ubica a la mitad entre los lmites inferiores de dos clase consecutivas.
Se calcula sumando el lmite inferior al lmite superior de una clase y se
divide esta suma por 2. La marca de clase se simboliza xi donde i es el

nmero de la clase correspondiente, as si se toma la clase 23 26, su


23 + 26
= 24.5 .
marca de clase es
2
La distribucin de frecuencias para el ejemplo 1 se muestra en la tabla
5.
Edades

xi

fi

hi

11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total

12.5
15.5
18.5
21.5
24.5
27.5
30.5
150.5

17
35
61
32
18
9
8
180

0.0944
0.1944
0.3389
0.1778
0.1000
0.0500
0.0444
1.0000

9.44
19.44
33.89
17.78
10.00
5.00
4.44
100.00

Tabla 5. Distribucin de frecuencias, marcas de clase y frecuencias relativas


del ejemplo 1.

De acuerdo a la distribucin de frecuencias construidas se puede


enunciar, por ejemplo que un 17.78% de los jvenes que asistieron a la
fiesta tenan entre 20 y 23 aos. Al analizar la distribucin tambin se
puede responder a las preguntas:

Cuntos estudiantes tienen entre 20 y 23 aos? Se observa la


distribucin y la clase 20 23. La frecuencia ( el nmero de jvenes) en
esta clase es de 32.

Qu porcentaje de los jvenes tiene menos de 26 aos? Se nota


que los jvenes de menos de 26 aos estn las clases 11 14 , 14 17,
17 20 , 20 23 y 23 26, luego si se suma los porcentajes de cada
una de estas clases se obtiene el porcentaje total de los que tiene
menos de 26 aos, es decir (9.44 + 19.44 + 33.89 + 17.78 + 10.00)%
= 90.55%

2.3. Propiedades de las distribuciones de frecuencia.


distribuciones de frecuencia cumplen las siguientes propiedades:

Las frecuencias de clase son enteros no negativos, es decir, f i 0 .

Las

Las frecuencias relativas son nmeros no negativos menores que 1, o


sea, 0 hi 1 .

La suma de todas las frecuencia relativas es igual a 1, esto es,


n

= 1 , donde n es el nmero de datos.

i =1

La suma de todas las frecuencias es igual a la totalidad de los datos,


n

es decir,

fi = n .

i =1

3.

REPRESENTACIONES TALLO Y HOJA.

En una distribucin de frecuencias se puede visualizar rpidamente la


forma de la distribucin, o sea, que se puede ver dnde se concentran
los datos y si hay valores extremadamente grandes o pequeos. Esto
constituye una gran ventaja aunque se puede sealar como
desventajas:

No se puede identificar con exactitud cada dato del conjunto.


No se sabe con seguridad cmo se distribuyen los datos dentro de la
clase.

En el ejemplo 1, si se toma la clase 17 20 se puede saber que hay 61


jvenes que tienen entre 17 y 18 aos; pero si se pregunta cuntos
tienen 17 aos?, cuntos tienen 18? Y cuntos tienen 19? No se
obtendra la respuesta con la distribucin de frecuencias.
La representacin tallo y hoja es una tcnica que se utiliza para mostrar
informacin cuantitativa en forma ms condensada. En esta
representacin se puede identificar cada valor de la observacin.
El nombre tallo y hoja se refiere a que si se tiene un nmero, este est
compuesto por el tallo que es el primer dgito y la hoja que son los
dgitos que le siguen. Por ejemplo, en el nmero 27 su tallo es 2 y su
hoja es 7. Si en un conjunto de datos un nmero est repetido k veces,
entonces se coloca el tallo y se colocan k hojas, as por ejemplo, si el 14
est 6 veces en un conjunto de datos entonces el tallo es 1 y la hoja es
444444.
Para la distribucin de edades del ejemplo 1, la representacin de tallo y
hoja se muestra en la tabla 6.

Se puede sacar varias conclusiones de esta representacin, por ejemplo,


la edad menos presente en la fiesta es 28 y 29 aos. La edad ms
presente es 18 aos. 52 jvenes tienen menos de 20 aos.

Tallo
1

2
3

Hoja
22222222
333333333
4444444444
555555555555555
6666666666
77777777777777777777
888888888888888888888 99999999999999999999
0000000000 111111111111 2222222222 33333 44444444
55555 6666 777 88 99
000 111

Tabla 6. Representacin tallo y hoja para el conjunto de datos del ejemplo 1.

4. REPRESENTACIONES GRFICAS DE UNA DISTRIBUCIN DE


FRECUENCIAS.
Generalmente resulta muy conveniente resaltar informacin contenida
en una tabla de una distribucin de frecuencias. Para tal fin se utilizan
diagramas o grficas.
Existen diagramas tales como el histograma, el polgono de frecuencias,
el polgono de frecuencias acumuladas y diagramas circulares, entre
otros, que representan de una manera adecuada una distribucin de
frecuencias.
Al construir una grfica en el plano cartesiano, se acostumbra ubicar a
las clases en el eje de las abcisas (eje X) y las frecuencias en el eje de
las ordenadas (eje Y).
4.1. Histograma. Es uno de los diagramas que se utiliza con mayor
frecuencia. Es una grfica hecha con rectngulos donde la base y la
altura de cada uno son la clase y la frecuencia correspondiente,
respectivamente.
Cada
rectngulo
se
coloca
adyacente
al
inmediatamente anterior a l.
El histograma de la distribucin del ejemplo 1 se muestra en la figura 4.
En l se observa que la concentracin de los datos se da en la clase 17
20, es decir que la mayora de las edades se encuentran entre 17 y 20
aos.
Dentro de Las ventajas de los histogramas se pueden anotar:

Permite visualizar de manera rpida el comportamiento e los datos


en la distribucin de frecuencias.
Los rectngulos muestran cada clase de la distribucin por separado.
El rea de cada rectngulo, en relacin con el resto, muestra la
proporcin del nmero total de observaciones que se encuentran en esa
clase.

Figura 4. Histograma de la distribucin de frecuencias del ejemplo 1.

4.2 Polgono de frecuencias. Es similar al histograma, est formado


por segmentos de rectas que une puntos de coordenadas ( xi , f i ) donde
xi es el punto medio de cada clase y f i es la frecuencia de clase i . Se

aaden dos clases, una antes de la primera clase y la otra despus de la


ltima. En estas dos clases hay cero observaciones, por tanto sus
frecuencias son cero. Se encuentran los puntos medios de estas clases y
se ancla el polgono de frecuencias a cero, de tal manera que este se
empiece a construir desde el eje x.
Un polgono de frecuencias que utiliza frecuencias relativas de puntos de
dato en cada una de las clases, en lugar del nmero real de puntos, se
conoce como polgono de frecuencias relativas. Este polgono tiene la
misma forma que el polgono de frecuencias construido a partir del
mismo conjunto de datos, pero con una escala diferente en los valores
del eje vertical.

En la figura 5, se muestra el polgono de frecuencias para el conjunto de


datos del ejemplo 1.

Figura 5. Polgono de frecuencias de la distribucin de frecuencias del ejemplo


1.

De las ventajas de los polgonos de frecuencia se puede decir:

Es ms sencillo que su correspondiente histograma.


Traza con ms claridad el perfil del patrn de datos.
Se vuelve cada vez ms liso y parecido a una curva conforme se
aumenta el nmero de clases y el nmero de observaciones.
Se pueden superponer sobre unos mismos ejes dos o ms polgonos
de frecuencia para la comparacin de sus correspondientes
distribuciones de frecuencia.

Un polgono alisado mediante el aumento de clases y de puntos de dato


se conoce como curva de frecuencias.
4.3. Distribuciones de frecuencias acumuladas. Si se quiere
responder las preguntas referentes al ejemplo 1: hasta qu edad llega
el 50% de los jvenes en la fiesta?, cuntos estudiantes tienen menos
de 26 aos?, las respuestas se pueden obtener con el procedimiento
seguido en la seccin 2.2 utilizando la distribucin de frecuencias; pero
si se forma una distribucin de frecuencias acumuladas se podra
construir un polgono de ellas y las respuestas se podran dar con slo
verlo. Las frecuencias acumuladas se simbolizan Fi .

La tabla 7 muestra las frecuencias acumuladas para cada clase.


Edades
11
14
17
20
23
26
29

14
17
20
23
26
29
32

fi

Fi

17
35
61
32
18
9
8

17
52
113
145
163
172
180

Tabla 7. Clases, frecuencias y frecuencias acumuladas de la distribucin de


frecuencias del ejemplo 1.

La frecuencia acumulada para la clase 11 14 es su misma frecuencia


por ser la primera, es decir, no acumula porque antes no hay
frecuencias. Las dems frecuencias acumuladas se calculan sumando la
frecuencia acumulada inmediatamente anterior, por ejemplo, para la
clase 14 17 su frecuencia acumulada es 17+35 = 52, para la clase 17
20 su frecuencia acumulada es 61 + 52 = 113 y as sucesivamente.
Las frecuencias acumuladas reemplazan a las frecuencias en el polgono
de frecuencias, o sea, van en el eje de las ordenadas (eje Y). La figura 6
muestra el polgono de frecuencias acumuladas para el ejemplo 1.
Las caractersticas principales del polgono de frecuencias acumuladas
son:

El polgono empieza en cero, una clase antes de la primera clase y


termina en la ltima clase.
El polgono no cierra.
Cada punto del polgono tiene coordenadas ( xi , Fi ) , donde xi es la
marca de clase.

Para responder a las preguntas que se hicieron al principio de esta


seccin hay que seguir las flechas en el polgono de frecuencias
acumuladas como se indica en la figura 7.

Figura 6. Polgono de frecuencias acumuladas para la distribucin de


frecuencias del ejemplo 1.

Figura 7. Polgono de frecuencias acumuladas para la distribucin de


frecuencias del ejemplo 1 para obtener las frecuencias acumuladas.

Siguiendo la direccin de la flecha que va desde el eje de las frecuencias


acumuladas hasta el eje de las clases se puede establecer que la mitad
(90), es decir, el 50%, de los jvenes tiene menos de 17 aos. Si se
sigue la flecha que va desde el eje de las clases hasta el eje de las
frecuencias acumuladas se puede dar respuesta a la pregunta cuntos
jvenes tiene menos de 23 aos? La respuesta es aproximadamente
150.
4.4. Diagramas circulares. Tambin llamados tortas. Se divide un
crculo en tantas porciones como clases existan, de modo que a cada
clase le corresponde un arco de crculo proporcional a su frecuencia
absoluta o relativa. El arco de cada porcin se calcula usando la regla de
tres:
360 100%

360
x% y que al simplificar se
n x%
100%
obtiene n = 3.6 x . x% es el porcentaje dado y n es el ngulo que le
corresponde dicho porcentaje y que se debe trazar en el crculo, as por
ejemplo, si la frecuencia es el 25%, entonces el ngulo en el crculo es
n = 3.6 * 25 = 90 . Si ahora se tiene un nuevo porcentaje, por ejemplo del
40%, el ngulo es n = 3.6* 40 = 144 que se mide a partir del porcentaje
anterior. Para completar el total falta el 35% que corresponde a
n = 3.6*35 = 126 , medidos a partir del ngulo del porcentaje anterior. La
figura 8 muestra las distribuciones de los porcentajes en el crculo. La
suma de todos los ngulos es 90+144+126=360.

de donde se tiene n =

Figura 8. Diagrama circular que representa los porcentajes 25%, 35% y 40%.

5. EJERCICIOS DE LA UNIDAD.
5.1. El nmero de vacunas que se suministran a una determinada
poblacin se muestra en la siguiente tabla:
Vacuna
Miles
BCG
45
SABIN
100
DPT
70
SARAMPIN
40
TOTAL
255
Construya un diagrama circular con los datos de la tabla.
5.2. Las calificaciones obtenidas en la prueba de una asignatura son las
que se muestran en la siguiente tabla
3.9 4.7
3.2 3.6

3.1 3.3
3.7 4.2

4.0 4.3
5.0 4.0

4.5
3.8

3.8 4.8 3.5


3.6 3.5 4.8

Construya una distribucin de frecuencias con un histograma, un


polgono de frecuencias y un polgono de frecuencias.
5.3. En el siguiente conjunto de datos, se proporcionan los pesos
(redondeados a libras) de nios nacidos en cierto intervalo de tiempo:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9,
7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.

Construir una distribucin de frecuencia de estos pesos.


Encontrar las frecuencias relativas.
Encontrar las frecuencias acumuladas.
Encontrar las frecuencias relativas acumuladas.
Dibujar un histograma con los datos.

5.4. Se les pregunt a un grupo de 35 personas sus estaturas, las


respuestas se encuentran consignadas en la siguiente tabla:

152 163 154 164 166 154 170


163 162 168 168 172 170 160
161 158 165 165 151 161 157
160 155 158 158 170 169 168
155 156 162 162 166 168 160

Construya una distribucin de frecuencias.

Elabore
Elabore
Elabore
Elabore
Elabore

un polgono de frecuencias.
un diagrama circular.
un histograma.
un polgono de frecuencias acumuladas.
una representacin tallo y hoja.

5.5. Los datos sealan el tiempo (en horas) que demora un cierto tipo
de lmpara incandescente.

20,25,24,26,30,35,32,31,18,15,23,25,26,24,21,23,29,35,18,23,24,16,
18,19,20,20,20,25,26,22,32,31,30,30,30,30,30,25,22,24,26,21,26,25,2
32,21,15,14,13,14,16,17,19,19,19,18,18,15,14,20,20,22,23,26,24,25,
20.
Construya un diagrama de frecuencias con los datos.
Construya un polgono de frecuencias acumulada.
Dnde se concentran los datos?
Construya una representacin tallo y hoja, cul es el dato que ms
se repite?

UNIDAD III MEDIDAS DE TENDENCIA CENTRAL


Y MEDIDAS DE DISPERSIN.
OBJETIVO GENERAL. Calcular
tendencia central y de dispersin.

adecuadamente

las

medidas

de

OBJETIVOS ESPECFICOS.
Calcular la media aritmtica, la media ponderada, la mediana, la
moda y la media geomtrica para datos dispersos y datos agrupados
en una distribucin de frecuencias.
Conocer y explicar las ventajas y desventajas de cada una de las
medidas de tendencia central.
Interpretar las medidas de tendencia central y de dispersin para
analizar los datos estadsticos.
Calcular las medidas de dispersin tales como la varianza, la
desviacin estndar y el coeficiente de dispersin en datos dispersos
y datos agrupados.
1. INTRODUCCIN.
Al tener un conjunto de datos es posible describirlos de dos maneras: la
primera como se hizo en la segunda unidad, es decir, por medio de una
distribucin de frecuencias, una representacin tallo y hoja, un
histograma, un polgono de frecuencias, entre otros. La segunda forma,
como se har en esta unidad, es describirlos mediante un nico valor
que sea representativo de todos los datos. A este valor se le conoce
como medida de tendencia central. Se hace necesario saber que tan
dispersos estn todos los datos respecto a esa medida de tendencia
central, es por eso que adems se estudia en esta unidad las medidas
de dispersin.
2. MEDIA ARITMTICA.
Tambin llamada promedio aritmtico. Si se suman cada uno de los
valores de una variable x y se divide el resultado por el nmero de
valores sumados, se obtiene la media aritmtica o promedio. Cuando se
trabaja con poblaciones se calcula la media poblacional y cuando se
trabaja con muestras se calcula la media muestral. En las frmulas para
calcular la media se utiliza el smbolo de la sumatoria que es una
forma

condensada

de

expresar

una

suma.

As

la

suma
n

X 1 + X 2 + X 3 + ... + X N , se puede condensar mediante la expresin

X
i =1

que se lee : Sumatoria de todos los X i (equis sub i ) desde que i = 1


6

hasta

que

i = n.

Por

i = 1 + 2 + 3 + 4 + 5 + 6 = 21

ejemplo,

i =1

= 21 + 2 2 + 23 + 2 4 = 30 .

i =1

De ahora en adelante cuando se hable de media, se har referencia a la


media aritmtica, a menos que se indique lo contrario.
2.1. Media poblacional. Se simboliza con la letra griega (mu). Es
la suma de todos los valores de la poblacin, dividida entre el nmero
n

X
total de dichos datos. Se calcula mediante la frmula =

i =1

, donde:

: es la media poblacional.
n : es el nmero total de datos de la poblacin.
X i : Valor i de la poblacin.
Ejemplo 2. Una pequea empresa cuenta con 5 empleados cuyos
salarios se muestran en la tabla 8. Calcule la media de los salarios.
Empleado

Salario ($)

500000

2
3

550000
600000

4
5

500000
490000

Tabla 8. Salarios de empleados de una pequea empresa del ejemplo 2.

Solucin.
Como se toma toda la poblacin de la empresa, entonces la media es
poblacional, luego la media es:
5

X
=

i =1

500000 + 550000 + 600000 + 500000 + 490000


= 528000 .
5
___

2.2. Media muestral. Se simboliza por X y es la suma de los valores


de una muestra, dividida entre el nmero total de los mismos, se calcula

__

mediante la frmula X =

i =1

. La media muestral, o cualquier otra


n
medida basada en una muestra se le conoce como dato estadstico.
Ejemplo 3. El director de personal del Hospital Universitario de
Santander inici un estudio acerca de las horas extras de tiempo de las
enfermeras. Seleccion al azar 10 de ellas durante el mes de febrero y
se anotaron las horas extras laboradas. La tabla 9 muestra los datos.
Enfermera Horas extras laboradas
1

13

2
3

13
12

4
5

15
17

6
7

13
15

8
9
10

16
16
17

Tabla 9. Horas extras laboradas por las enfermeras del Hospital Universitario
de Santander para el ejemplo 3.

Solucin.
Como es una muestra de la poblacin de todas las enfermeras del
hospital, entonces se calcula la media muestral:
10

__

X=

i =1

10

13 + 13 + 12 + 15 + 17 + 13 + 15 + 16 + 16 + 17
= 14.7 .
10

2.3. Propiedades de la media aritmtica. La media aritmtica


cumple las siguientes propiedades:
La suma de las desviaciones de cada valor, respecto a la media
siempre ser igual a cero. La desviacin es la diferencia (resta) de cada
valor respecto a la media. Esta propiedad, en forma simblica, se
n

expresa:

(M X ) = 0 ,
i

es

decir,

(M X 1 ) + (M X 2 ) + ... + (M X n ) = 0 ,

i =1

donde M es la media poblacional o muestral, para el ejemplo 3, se


verifica esta propiedad:

(14.7 13) + (14.7 13) + (14.7 12) + (14.7 15) + (14.7 17 ) + (14.7 13) + (14.7 15) + (14.7 16)
+ (14.7 16 ) + (14.7 17 ) = 0
Si todos los valores obtenidos son iguales a un valor constante k,
entonces la media es ese valor. Por ejemplo, una persona tiene un
salario mensual de $800.000, entonces la media del ingreso al ao ser
$800.000,
as:
800.000 + 800.000 + 800.000 + 800.000 + 800.000 + 800.000 + 800.000 +

800.000 + 800.000 + 800.000 + 800.000 + 800.000


= 800.000
12
Si a cada dato se le suma un nmero constante, entonces la media
ser la media de los datos ms la constante.

Si a cada dato se le suma un nmero constante, entonces la media


ser la media de los datos ms la constante, por ejemplo, las estaturas
de los jugadores de un equipo de baloncesto son 2, 2.1, 2.3, 1.9 y 1.95
2 + 2.1 + 2.3 + 1.9 + 1.95
su media es =
= 2.05 m . Si ahora se le suma a cada
5
dato el valor constante 3, se obtiene

(2 + 3) + (2.1 + 3) + (2.3 + 3) + (1.9 + 3) + (1.95 + 3)


= 5.05 = 2.05 + 3
5

Si cada dato se multiplica por una constante, entonces el valor de la


media queda multiplicado por ese mismo valor. As, si en el ejemplo de
las estaturas se multiplica cada dato por 1.5, entonces se tiene
(2 * 1.5) + (2.1 * 1.5) + (2.3 * 1.5) + (1.9 * 1.5) + (1.95 * 1.5) 3 + 3.15 + 3.45 + 2.85 + 2.925
=
=
5
5
= 3.075 = 2.05 * 3

Una desventaja de la media es que ella toma en cuenta todos los valore
de una muestra o poblacin, es posible que encontrarse con valores
muy grandes o muy pequeos comparados con los dems, por lo tanto
la media no sera muy representativa del conjunto de datos, por
ejemplo, las edades de un grupo de 5 personas son 20, 33, 23, 19 y 85
aos, se ve que 85 aos es un valor muy grande comparado con los
dems.
La
media
para
este
conjunto
de
datos
es
20 + 33 + 23 + 19 + 85
=
= 36 aos que no es un valor representativo del
5
conjunto de datos, pues es mayor que la mayora de todos ellos.

3. MEDIA PONDERADA.
Es un caso especial de la media aritmtica. Se aplica cuando hay
observaciones con un mismo valor, lo cual puede ocurrir si los datos se
han agrupado en una distribucin de frecuencias. Se calcula mediante la
n

x f

i i

__

frmula: X p =

i =1
n

, donde f i es la frecuencia con que se repite el dato,


i

i =1

tambin llamado peso y n es el nmero de datos.


Ejemplo 4. Una empresa contratista paga a sus empleados $20000,
$30000 o $35000 por da. Hay 30 empleados, 10 reciben el pago de
$20000 al da, 8 reciben $30000 al da y 12 reciben $35000 al da.
Calcule el promedio ponderado.
Solucin.
3

__

x f

Xp =

i =1
3

i i

20000 * 10 + 30000 * 8 + 35000 * 12 200000 + 240000 + 420000


=
= $28666.7
10 + 8 + 12
30

i =1

4. MEDIANA.
Si en un conjunto de valores se observan que la tendencia de los datos
est sesgada (inclinada) hacia los valores altos o hacia los bajos,
entonces es conveniente utilizar una medida ms representativa llamada
mediana.
La mediana es el valor que corresponde al punto medio de los datos
despus de ordenarlos de menor a mayor o viceversa de tal manera que
el 50% de dichos datos son mayores que ella y el otro 50% menores.
Para cuando el nmero de datos es pequeo ( n 30 ), la mediana se
puede calcular de dos formas:
Si el nmero de datos es impar. Una vez que los datos estn
organizados en orden creciente o decreciente, entonces la mediana
estar a la mitad de los datos. Por ejemplo, se tienen los siguientes
datos: 1,7,25,4,7,2,8,7,1,6,6. Al organizarlos de mayor a menor, se

tiene: 25,8,7,7,7,6,6,4,2,1,1. El dato central es 6, que es la media del


conjunto de datos.
Si el nmero de datos es par. Despus de organizar los datos, la
media ser la media de los dos datos centrales. Por ejemplo dados los
datos 2,3,6,5,4,5,9,10,11,13,16 y 18, al organizarlos se tiene:
2,3,4,5,5,6,9,10,11,13,16,18. Los datos centrales son 6 y 9 y su media
es 7.5 que es la mediana del conjunto de datos.

La media no es afectada por los valores extremos, es decir, si en el


conjunto de datos 1,7,25,4,7,2,8,7,1,6,6, en vez de 25 estuviera
330000, la mediana sigue siendo 6.
4.1. Propiedades de la mediana. Las propiedades ms importantes
de la mediana son:

La mediana es nica, es decir, slo existe una mediana para un


conjunto de datos.
La mediana no se ve afectada por datos muy pequeos o muy
grandes.
Puede calcularse para datos de nivel de razn, e intervalo y ordinal.

5. MODA.
Es el valor e la observacin que aparece con ms frecuencia. La moda
es muy til para describir datos de nivel nominal y ordinal, aunque se
puede utilizar en cualquier nivel de datos.
Ejemplo 5. En el siguiente grupo de datos, Cul es la moda o valor
modal? 2,7,6,5,3,3,2,4,5,3,8,9,7,2,3,3.
Solucin.
El dato que ms se repite es 3, por tanto la moda de este conjunto de
datos es 3.
La moda tiene la desventaja de que muchos conjuntos de datos no
tienen valor modal porque ningn dato aparece ms de una vez. Es
posible tambin que un conjunto de datos tenga dos modas (bimodal) y
en ese caso la moda no sera representativa.
6. MEDIA GEOMTRICA.
Se utiliza para encontrar el promedio de porcentajes, razones, ndices o
tasas de crecimiento. La media geomtrica es menor que la media

aritmtica. La media geomtrica de un conjunto de n datos es la raz


ensima del producto de los valores. Se calcula mediante la frmula
MG = n X 1 X 2 X 3 ... X n . Cada uno de estos valores debe ser positivo. En el
ejemplo 6 se ver como se puede aplicar la media geomtrica.
Ejemplo 6. Supongamos que un trabajador tiene un sueldo de
$500.000 y que va a recibir aumentos en tres meses consecutivos
discriminados as: 5% para el primer mes, 10% para el segundo mes y
15% para el tercer mes. Si se desea aumentar en forma constante el
sueldo en esos tres meses, cul sera el porcentaje para obtener el
mismo aumento total? Cul ser el sueldo para el cuarto mes?
Solucin.
La tabla 10 muestra los aumentos por mes del sueldo del trabajador:
Sueldo ($)
500000
525000
577500

% Nuevo sueldo ($) Aumento($)


5
525000
25000
10
577500
52500
15
664125
86625
TOTAL
164125

Tabla 10. Aumento en porcentajes del sueldo del trabajador.

Claramente el sueldo al final de todos los aumentos es $664.125. si se


quiere aumentos constantes entonces debe calcularse la media
Geomtrica: MG = 3 X 1 X 2 X 3 = 3 1.05 * 1.15 * 1.1 = 1.09924 . Esto indica que el
promedio de los aumentos debe ser de 9.924%, o sea, que si se
aumenta a este promedio en forma constante, se obtiene el mismo
aumento. La tabla 11 ilustra estos aumentos:
Sueldo ($) MG (%) Nuevo sueldo ($) Aumento($)
500000.00 9.924
549620.00
49620.00
549620.00 9.924
604164.30
54544.30
604164.30 9.924
664121.56
59957.26
TOTAL
164121.56
Tabla 11. Aumentos a porcentajes constantes del sueldo.

6.1. Aumento porcentual promedio en un perodo determinado.


Si una poblacin o un determinado capital crece en n perodos
determinados, es posible encontrar el promedio de crecimiento
porcentual con solo conocer el valor al principio y al final. Es decir, si se
sabe que una variable creci porcentualmente a un ritmo no constante,
es posible hallar el incremento porcentual de forma constante en cada

perodo. Este incremento porcentual constante se calcula por la frmula


Valor al final de los perodos
MG = n
1 .
Valor al inicio de los perodos
Ejemplo 7. La produccin de camiones de una fbrica aument de
23000 unidades en 1978 a 120520 unidades en 1998, cul fue la tasa
de incremento porcentual anual promedio constante para el perodo?
Solucin.
Aqu el valor al final del perodo es 120520 en 1998 y el valor al
principio del perodo es 23000 en 1978, es decir, n es 20 aos. Entonces
120520
MG = 20
1 = 0.086 . Esto significa que es como si la produccin
23000
estuviera aumentando a razn constante de 8.6% por ao.

7. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS.


Cuando se tiene una gran cantidad de datos es muy tedioso hallarle sus
medidas de tendencia central a menos que ellos se encuentren
agrupados en una distribucin de frecuencias.
7.1. Media. Se considera que las observaciones en cada clase estn
representadas por la marca de clase (punto medio de cada clase), para
n

su clculo se emplea la frmula

__

fx

X=

i =1
n

i i

__

, donde

X es la media

i =1

aritmtica, xi es la marca de clase, f i es la frecuencia de clase y n es el


nmero total de clases.
Ejemplo 8. Los gastos publicitarios de 60 empresas colombianas se
presentan en la distribucin de frecuencias como se muestra en la tabla
12.
GASTOS (MILLONES)
25
35
45
55
65

35
45
55
65
75

NMERO DE EMPRESAS

Fi

xi

5
10
21
16
8

5
15
36
52
60

30
40
50
60
70

Tabla 12. Gastos en millones de pesos en publicidad de 60 empresas


colombianas.

Solucin.
Segn la frmula para la media de datos agrupados, se tiene:
5

__

fx

X=

i =1
5

i i

5*30 + 10* 40 + 21*50 + 16*60 + 8*70


= 57.33
60

i =1

7.2. Mediana. Para datos agrupados no es posible encontrar la


mediana exacta pues los datos no son identificables. Slo se puede
hacer una estimacin de ella. Para estimar la mediana se utiliza la
n
Fi
2
I donde:
frmula Med = L +
f CLASE
L
Es el lmite inferior de la clase que contiene la mediana.
n
Es el nmero total de frecuencias.
f CLASE Es la frecuencia de la clase que contiene la mediana.
Fi

Es la frecuencia acumulada de las clases que estn antes de la

clase que contiene la mediana.


I
Es la amplitud del intervalo o clase que contiene la mediana.
De acuerdo al ejemplo 8 la mediana debe ser el valor que divide el
nmero de datos en dos partes iguales de tal forma que el 50% de ellos
est por encima y el otro 50% por debajo. Como hay 60 datos, entonces
hay 30 datos por encima y 30 datos por debajo de la mediana, o sea,
que la mediana debe estar en la clase que contenga el dato 30, Al ver
en la frecuencia acumulada en la tabla 12 se nota que hay 15 empresas
que gastaron menos de 45 millones y 36 que gastaron menos de 55
millones, es decir, el dato 30 se encuentra en la clase 45 55 millones.
La figura 9 ilustra la situacin planteada.

Figura 9. Ubicacin del dato mitad en la clase 35 45 para el ejemplo 8.

Los elementos de la frmula para la mediana son:

L = 45 ,

n = 60 ,

Fi = 15 ,

f CLASE = 21

I = 10 .

Luego

la

mediana

es

60
15
Med = 45 + 2
*10 = 52.14 .
21
7.3. Moda. La moda se aproxima al punto medio de la clase que
contenga el mayor nmero de frecuencias de clase. Para el ejemplo 8, la
clase que contiene el mayor nmero de frecuencias es 45 55 y su
punto medio es 50, por tanto ese es el valor de la moda.

8. MEDIDAS DE DISPERSIN.
La media, la mediana y la moda slo localiza el centro de los datos; pero
no dice nada acerca de cmo estn dispuestos respecto a la medida de
tendencia central. No es significativo saber cul es la medida de
tendencia central de un conjunto de datos si no se sabe que tan
apartados estn los datos de esa medida. Es decir, tomar una decisin
con slo saber una medida de tendencia central es arriesgado. Por
ejemplo, si usted va a cruzar un ro y ve un aviso que dice que la
profundidad promedio es de 1.5 metros usted lo cruzara con toda
confianza? Muy seguramente si decide o no, sera muy apresurado de su
parte. Pero si en el aviso se anuncia que las profundidades del ro a lo
ancho no estn muy alejadas del promedio, digamos que como mximo
0.2 m, la decisin ahora de cruzar o no el ro tiene mayor respaldo. En
conclusin se necesitara saber cmo varan las profundidades respecto
al promedio, o sea, qu tan dispersas estn las medidas de las
profundidades respecto al promedio.
8.1. Amplitud o intervalo de variacin. Es la diferencia entre el valor
ms grande y el valor ms pequeo de un conjunto de datos, por
ejemplo si los datos son 2,7,8,9,6,3,5 y 2, entonces la amplitud de
variacin es Av = 9 2 = 7 .
8.2. Desviacin media. Es el promedio de los valores absolutos de las
desviaciones con respecto a la media aritmtica. La desviacin de un
dato respecto a la media es la diferencia entre estos valores. Por
ejemplo si la media de un conjunto de datos es 5.3 y si de este conjunto
se toma a 5.8, entonces la desviacin media es 5.3 5.8 = 0.5 . La frmula
n

__

Xx

para calcular la desviacin media es Dm =


xi es el dato i y n es el nmero de datos.

i =1

__

donde X es la media,

El valor absoluto asegura que las diferencias entre la media y cada dato
sea positiva.
Ejemplo 9. El peso de 5 cajas de llenas de cereales, escogidas al azar,
es de 300, 310, 305, 300 y 308 gramos. Determine la desviacin media.
Solucin.
Antes se debe calcular la media, que para el caso es poblacional:
300 + 310 + 305 + 300 + 308
=
= 304.6
Luego la desviacin media es
5
5

304.6 x

Dm =
=

i =1

304.6 300 + 304.6 310 + 304.6 305 + 304.6 300 + 304.6 308
5

18.4
= 3.68
5

Esto significa que la media de todas las desviaciones respecto a la media


de los datos es 3.68.
8.3. Varianza. Otra forma de evitar que las desviaciones respecto a la
media aritmtica sean negativas es elevarlas al cuadrado. La varianza es
la media aritmtica de las desviaciones cuadradas. La varianza puede
ser poblacional, que se simboliza por la letra griega sigma al cuadrado
( 2 ); o puede ser muestral, simbolizada por la letra ese al cuadrado
n

( xi )
( s 2 ). Las frmulas para cada caso son: 2 =

i =1

__

X xi

y s 2 = i =1
n 1
n

__

donde es la media poblacional, X es la media muestral, xi es el dato


i y n es el nmero total de datos de la muestra o poblacin, segn el
caso.
Ejemplo 10. Se cuenta con un grupo de 6 nios cuyas edades son: 7,
8, 6, 8, 7 y 9 aos. Cul es la varianza de esta poblacin?
Solucin.
La media de la poblacin es 7.5, entonces la varianza poblacional es
6

( 7.5 x )
i

i =1

2
2

( 7.5 7 ) + ( 7.5 8) + ( 7.5 6 ) + ( 7.5 8 ) + ( 7.5 7 ) + ( 7.5 9 )


=
6

5.5
= 0.912
6
Es decir que la media de todas las desviaciones cuadradas es 0.912.
=

Ejemplo 11. Se toma una muestra de 5 personas de una empresa y se


pregunta por sus salarios. Sus respuestas fueron: $500000, $800000,
$700000, $650000, $550000. Cul es la varianza para esta muestra?

Solucin.
La media de la muestra es $640000, entonces la varianza muestral es:
5

( 640000 x )

s2 =

i =1

5 1
2

( 640000 500000 ) + ( 640000 800000 )


2
2
2
+ ( 640000 700000 ) + ( 640000 650000 ) + ( 640000 550000 )
=
4

61000000000
= 15250000000
4

8.4 Desviacin estndar. Es la raz positiva de la varianza. Tambin


puede ser poblacional ( ) o muestral ( s ). Las frmulas respectivas son:
2

__

x
(
)

X xi
i
. Para el ejemplo 10 la desviacin
= i =1
y s = i =1
n
n 1
estndar poblacional es = 0.912 = 0.955 y para el ejemplo 11, la
desviacin estndar muestral es s = 15250000000 = 123490.89 .
n

8.5 MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS.


Es posible encontrar las medidas de dispersin para datos agrupados en
una distribucin de frecuencias.
8.5.1. Amplitud de variacin. Es la diferencia entre el lmite inferior
de la clase ms baja y el lmite superior de la clase ms alta, por
ejemplo, si se tiene una distribucin de frecuencias como la que se
muestra en la tabla 13, donde se muestra las ventas de 50 empresas.
Ventas (Miles de pesos) Nmero de empresas
100 120
5
120 140
7
140 160
9
160 180
16
180 200
10
200 220
3

TOTAL

50

Tabla 12. Distribucin de frecuencias de las ventas de 50 empresas.

La amplitud de variacin es Av = 220 100 = 110


8.5.2. Desviacin estndar. La frmula de la desviacin estndar para
datos agrupados en una distribucin de frecuencias es:
n

i =1

f i xi

f i xi2 i =1 n
fi

i =1

s=

i =1

Donde s es la desviacin estndar muestral, xi es la marca de clase, f i


es la frecuencia de clase y n es el nmero de clases. Para el ejemplo
anterior los clculos de cada miembro de la frmula se realizan en la
tabla 13, para mayor comodidad.
Ventas
100
120
140
160
180
200

120
140
160
180
200
220

fi

xi

xi2

f i xi2

f i xi

5
7
9
16
10
3

110
130
150
170
190
210

12100
16900
22500
28900
36100
44100

60500
118300
202500
462400
361000
132300

550
910
1350
2720
1900
630
6

f
TOTAL

f i = 50

f
i =1

xi = 8060

i =1
i

xi2 = 1337000

f i xi = 64963600
i =1

Tabla 13. Clculo de los miembros de la frmula de la desviacin estndar


para datos agrupados.

Al reemplazar los valores, se obtiene:

fi xi
6

fi xi2 i =1 n

i =1
fi
s=

i =1
6

64963600
1337000 1299272
50
=
= 27.74
50 1
49

1337000
=

i =1

8.6. DECILES, CUARTILES Y CENTILES.


Son medidas de dispersin que dividen los datos en partes iguales, as
los deciles los dividen en 10 partes iguales, los cuartiles en 4 partes
iguales y los centiles en 100 partes iguales. La figura 10 esquematiza la
posicin de estas medidas.

Figura 10. Esquematizacin de las posiciones de a) cuartiles ,b) deciles, c)


centiles.

Se podra pensar que los deciles cuartiles y centiles no son medidas de


dispersin porque slo dividen el conjunto de datos en partes iguales,
como lo hace la media; pero la dispersin se nota cuando se habla que
un porcentaje de los datos est por encima de una de estas medidas.
Segn el esquema de la figura 10 se puede ver por ejemplo que el
cuartil Q1 separa el 25% del 75% restante a la derecha, el decil D7
separa el 70% del 30% restante a la derecha y que el centil 33 separa
el 33% de los datos de 67% restante a la derecha. Es decir cada una de
estas medidas separa un cierto porcentaje de datos a la derecha o a la
izquierda. Las tablas 14, 15 y 16 muestran los porcentajes que separan
cada una de estas medidas de dispersin.

Cuartil

Porcentaje menor

Porcentaje mayor

Q1
Q2

25%
50%

75%
50%

Q3

75%

25%

Tabla 16. Porcentajes que separan los cuartiles de un conjunto de datos.

Es de notar que el cuartil Q2 es equivalente a la mediana porque separa


el 50% de los datos. Tambin el decil D5 y el centil C50 son
equivalentes a la mediana.
Decil

Porcentaje menor

Porcentaje mayor

D1
D2

10%
20%

90%
80%

D3

30%

70%

D4

40%

60%

D5
D6

50%
60%

50%
40%

D7
D8

70%
80%

30%
20%

D9

90%

10%

Tabla 17. Porcentajes que separan los deciles de un conjunto de datos.

Centil

Porcentaje menor

Porcentaje mayor

C1
C2

1%
2%

99%
98%

C3

3%

97%

C4

4%

96%

C5
C6

5%
6%

95%
94%

D7
.
.
.
C98

7%
.
.
.
98%

93%
.
.
.
2%

C99

99%

1%

Tabla 18. Porcentajes que separan los centiles de un conjunto de datos.

Para ubicar un cuartil, un decil o un centil se utiliza la frmula


P
L = ( n + 1)
, donde n es el total de observaciones y P puede ser el
100
cuartil, decil o centil que se quiere ubicar y toma el valor del porcentaje
menor que la medida separa. Por ejemplo si se quiere situar el tercer
cuartil, entonces P = 75 ya que este cuartil separa el 75% de los datos
del restante 25% que queda mayor (ver tabla 16).
Note que la frmula da la ubicacin de la medida ms no da la medida
en s. El procedimiento para conocerla se describe en el ejemplo 12.
Ejemplo 12. Determine los valores correspondientes al sexto decil,
primer cuartil, y el centil 67 del conjunto de datos:
34 13 41 20 47 26 27 31 34 35 62 35 36 37 38 41 45 47 50 51 53 13
54 56 67 82 13 41 34 47.
Solucin.
El nmero total de datos es n = 30 .
Lo primero que se hace es organizar los datos de menor a mayor:
13 13 13 20 26 27 31 34 34 34 35 35 36 37 38 41 41 41 45 47 47 47
50 51 53 54 56 62 67 82.
Ubicacin del primer cuartil. n = 30
y P = 25 , entonces
25
L25 = ( 30 + 1)
= 31*0.25 = 7.75 , esto significa que el primer cuartil est en
100
la posicin 7.75. Esto es, se localiza la posicin 7 y se desplaza 0.75 a
la derecha. La primera posicin corresponde a 13 y contando siete a la
derecha se encuentra el dato 31. El primer cuartil se encuentra entonces
entre el dato 31 y 34, a 0.75 veces la distancia entre ellos. La distancia
entre 31 y 34 es 3. Para ubicar el primer cuartil hay que pasar a 0.75 de
la distancia entre estos valores, por lo que 0.75*3=2.25, luego el primer
cuartil es 31+2.25=33.25.

No necesariamente la medida que se encuentra debe pertenecer al


conjunto de datos.
Ubicacin
del
sexto
decil.
n = 30
y
P = 60 ,
entonces
60
L25 = ( 30 + 1)
= 31* 0.6 = 18.6 , es decir que el sexto decil est en la
100
posicin 18 ms 0.6 la distancia entre los valores de la posicin 18 y la
posicin 19.
Contando los datos organizados, la posicin 18 le
corresponde al valor 41 y la posicin 19 al valor 45. La distancia entre
41 y 45 es 4, luego el sexto decil es 41+0.6*4=43.4.

Ubicacin
del
centil
67.
n = 30
y
P = 67 ,
entonces
67
L25 = ( 30 + 1)
= 31* 0.67 = 20.77 , o sea que el centil 67 est en la posicin
100
20.77. En al posicin 20 est 47 y en la posicin 21 tambin est 47, es
claro que la distancia entre estos valores es cero, luego el centil 67 es
47+0*0.77=47. Es decir cuando dos datos consecutivos son iguales, la
medida es el valor repetido.

Si alguna de estas medidas da un resultado entero, significa que ella


est ubicada en un dato exacto que pertenece al conjunto.
8.7. INTERPRETACIN Y USOS DE LA DESVIACIN ESTNDAR.
Si se tiene un polgono de frecuencias con 7 clases, como se muestra
en la figura 11

Figura 11. Polgono de frecuencias con 7 clases.

Si se aumenta el nmero de clases a 14, se obtendr un polgono como


se muestra en la figura 12.

Figura 12. Polgono de frecuencias con 14 clases.

Se nota que al aumentar el nmero de frecuencias, el polgono tiende a


ser una curva suave. Si el nmero de clases crece hasta el infinito,
entonces el polgono de frecuencia se convierte en una curva continua,
como se muestra en la figura 13.

Figura 13. Polgono de frecuencias con infinitas clases.

Dentro de los polgonos de frecuencia de curva suave se destaca el de la


distribucin de frecuencia tipo campana o tambin llamada distribucin
simtrica, lo cual significa que la distribucin tiene la misma forma en
ambos lados del eje central. Si el polgono se doblara por la mitad,
ambas parteas coincidiran. En una distribucin de este tipo la moda, la

mediana y la media estn en el eje de simetra. La figura 14 muestra


una distribucin de frecuencias simtrica.
Cuando una distribucin de frecuencias de curva suave no es distribuida
simtricamente, se dice que el conjunto de datos es asimtrico o
sesgado. La asimetra puede se positiva o negativa. Una asimetra
positiva significa que la mayora de los datos estn a la derecha de la
lnea central. Una asimetra negativa significa que la mayora de los
datos estn hacia el lado izquierdo. Desde el punto de vista grfico una
distribucin con simetra positiva, est inclinada hacia la derecha y una
distribucin con simetra negativa est inclinada a la izquierda. Las
figuras 15 y 16 muestran, respectivamente, distribuciones con simetra
positiva y negativa as como tambin las posiciones de las medidas de
tendencia central moda, media y mediana.

Moda=Media=Mediana
Figura 14. Distribucin de frecuencias simtrica o de campana.

Figura 15. Distribucin de frecuencias con simetra positiva y ubicacin de las


medidas de tendencia central.

Figura 16. Distribucin de frecuencias con simetra negativa y ubicacin de las


medidas de tendencia central.

8.7.1. Teorema de Chebyshev. Cuando


en una distribucin de
frecuencias o en conjunto de datos la desviacin estndar es pequea,
entonces se dice que los datos no estn muy dispersos respecto a la
media y si la desviacin es relativamente grande, entonces los datos se
encuentran muy dispersos respecto a la media. El teorema de
Chebyshev permite calcular la proporcin mnima de los valores que se
encuentran en un mnimo de desviaciones estndar. Este teorema se
enuncia:
Para un conjunto cualquiera de observaciones (muestra o poblacin) la
proporcin mnima de los valores que se encuentran dentro de k
1
desviaciones estndar desde la media es por lo menos 1 2 donde k es
k
un nmero real fijo mayor que 1.
Esta regla se aplica sin importar el tipo o forma de la distribucin.
Ejemplo 13. La media de un conjunto de observaciones muestrales es
de 300, la desviacin estndar es de 20. De acuerdo al teorema de
Chebyshev, al menos qu porcentaje de los datos se encuentra entre
200 y 400?
Solucin.
Aqu, la desviacin estndar es s = 20 . El diagrama de la figura 17
muestra que el nmero de desviaciones estndar que hay entre los
valores 200 y 400 es de 10, este es el valor de k . Por tanto al aplicar la
frmula del teorema de Chebyshev, se tiene que el porcentaje mnimo

de datos que estn entre estos valores es 1

1
1
1
= 1 2 = 1
= 0.99 , es
2
k
10
100

decir el99%.

Figura 17. Esquema de la posicin de la media y el nmero de desviaciones


estndar que hay entre los datos 200 y 400.

8.7.2. Regla emprica. El teorema de Chebyshev se aplica a cualquier


tipo de distribucin de frecuencias. Pero para distribuciones de
frecuencia tipo campana existe la regla emprica que da mucha ms
precisin. Esta regla emprica dice: En una distribucin de frecuencias
simtrica tipo campana,
Aproximadamente el 68% de las observaciones estn entre ms o
menos una desviacin estndar desde la media.
Aproximadamente el 95% de las observaciones estn entre ms o
menos dos desviaciones estndar desde la media.
Casi todas las observaciones (99.7%) se encuentran entre ms o
menos tres desviaciones estndar desde la media.
La figura 18 ilustra esta regla.

Figura 18. Distribucin de frecuencias de tipo campana con las relaciones


entre la media, el porcentaje de datos y la desviacin estndar.

Ejemplo 14. Una muestra de tamaos de pollos de un galpn sigue


aproximadamente una distribucin de frecuencias de tipo campana. La
media de dichos tamaos es de 20 centmetros y la desviacin estndar
de 1.5 centmetros. Utilizando la regla emprica indique:
Aproximadamente, entre qu datos est el 68% de los tamaos?

Aproximadamente, entre qu datos est el 95% de los tamaos?


Aproximadamente, entre qu datos est la totalidad de los
tamaos?
Solucin.
El 68% de los datos est entre
20 1.5 = 18.5 y 20 + 1.5 = 21.5 .

__

__

X 1s y

X + 1s , es decir entre

__

__

El 95% de los datos est entre X 2 s y X + 2 s , es decir entre


20 2*1.5 = 17 y 20 + 2 *1.5 = 23 .
__

__

Casi la totalidad de los datos (99.7%) est entre X 3s y X + 3s , es


decir entre 20 3*1.5 = 15.5 y 20 + 3*1.5 = 24.5 .

8.8. DISPERSIN RELATIVA.


Se utiliza para comparar las medidas de dispersin de dos conjuntos de
datos que:
Tengan unidades diferentes.
Tengan las mismas unidades; pero los valores medios estn muy
distantes.
Por ejemplo, si se tiene que la media de las edades de un grupo de
personas es de 40 aos con una desviacin estndar de 5 aos; por otro
lado se cuenta con una muestra de salarios de una empresa cuya media
es $500000 con una desviacin estndar de $150000. Cmo se podr
saber que conjunto de datos est ms disperso, si en un conjunto hay
edades y en el otro hay salarios?
A fin de realizar una comparacin significativa de las distribuciones de
edades y salarios, es necesario convertir estas medidas a trminos
relativos. La medida que permite hacerlo se llama coeficiente de
s
variacin CV y se define como CV = __ *100% , es decir el cociente entre
X
la desviacin estndar y la media aritmtica.
Se calcula el coeficiente de variacin en los dos conjuntos de datos y se
comparan. Si los coeficientes son iguales, entonces los datos estn
igualmente dispersos, sino entonces el que tenga mayor coeficiente de
variacin estar ms disperso que el otro conjunto.

Para el ejemplo propuesto, los coeficientes de variacin son:


s
5
Para el conjunto de edades, CV = __ *100% = *100% = 12.5% .
40
X
s
150000
Para el conjunto de salarios, CV = __ *100% =
*100% = 30%
500000
X
Luego el conjunto de salarios se encuentra ms disperso respecto a su
media que el conjunto de edades.
9. EJERCICIOS DE LA UNIDAD.
9.1. En un centro hospitalario se ha tratado, con un nuevo
medicamento, durante 5 das a un grupo de pacientes. Todos ellos
padecen de dolor de cabeza crnico. Se realiza un estudio sobre el
nmero de das que un paciente siente mejora con el anterior
medicamento obteniendo la tabla:
Valores
xi

Frecuencias
fi

0
1
2
3
4
5

100
250
300
500
450
2000

Realizando el grfico adecuado y hallando los promedios (Media


aritmtica, Media geomtrica, Moda, y Mediana), indicar cul sera el
que mejor representara los datos, (Conteste razonadamente y con el
mayor detalle posible)
Calcule tambin, el porcentaje de pacientes que sienten mejora con
el medicamento en todos los das del tratamiento.
Por qu no se calcula el coeficiente de variacin para ver la
representatividad de la media? Habra que hallarlo?.

9.2. Una empresa automovilstica ha realizado un control de potencia


sobre los 1000 motores diesel que se han fabricado a lo largo del mes
de noviembre del ao 2004 obteniendo la siguiente tabla:
Potencia en CV

Frecuencias

0 50

50

50 60
60 - 65
65 - 70

200
400
300

Ms de 70

50

Represente grficamente el histograma de frecuencias.


Calcule la potencia mediana de los motores.
En la especificacin tcnica del motor se indica que tiene una
potencia mnima de 55 CV. Hallar el porcentaje de motores con
una potencia mayor que est (Nota: Realizarlo por Cuartiles)
Estudiar la representatividad de la media aritmtica. Sera
representativa?

9.3. Para el ejercicio anterior los motores con menos de 55 CV se


apartan de los dems y se estudia el nmero de piezas defectuosa que
han motivado la prdida global de potencia, obtenindose la siguiente
tabla:

Valores
xi

Frecuencias
fi

1
2
3
4

40
30
20
10

La media geomtrica y la media aritmtica guardan alguna relacin


de orden? Calcule ests medias y comprubelo.
Represente grficamente los distribucin de frecuencias de la tabla.
Calcule la moda.

9.4. Se ha realizado una estadstica en un centro comercial sobre los


gastos (en miles de pesos) que una familia tiene cuando realiza sus
compras un da cualquiera de la semana. Este estudio aporta la
siguiente tabla:
Intervalos

Frecuencias

05
5 10
10 20
20 - 50
50 100

100000
110000
160000
100000
30000

Cul es el motivo por el que los datos se presentan en


intervalos?
Son coherentes los datos de la tabla, o bien, se tendra que
estudiar su procedencia antes de continuar el estudio?
Halle los ingresos que en ese da tuvo el centro comercial y el
gasto medio, modal y mediano de cada familia.
Si a todas las familias que gastan ms de 40.000 pesos, se les
obsequia una bolsa de deporte o una cafetera, ambas valoradas
en 2.500 pesos. Hallar el nmero de regalos que realiza el centro
comercial, as como el porcentaje de clientes que se benefician de
ellos. (Nota: utilizar percentiles )
Halle el primer cuartil. Qu significado tiene?
Estudie
la
representatividad
del
gasto
medio.
Es
representativa? Por qu?

9.5. A la pregunta realizada a jugadores de ajedrez sobre el


nmero de horas que deben prepararse antes de un torneo se
obtuvo la siguiente distribucin de frecuencias:
Horas de preparacin
10 15
15 20
20 25
25 - 30
30 - 35
35 - 40

Determine
Determine
Determine
Determine

Nmero de jugadores
9
30
25
15
5
2

la desviacin estndar, mediana y moda.


los cuartiles Q1 y Q2.
los centiles C35 y C21.
los deciles D3 y D7.

UNIDAD IV PROBABILIDADES.
OBJETIVO GENERAL. Aplicar los conceptos de probabilidad en la
estadstica inferencial.
OBJETIVOS ESPECFICOS.
Definir el concepto de probabilidad.
Describir los diferentes enfoques de la probabilidad: clsico, emprico
y subjetivo.
Interpretar en forma correcta los trminos: espacio muestral,
experimento, evento o suceso, resultado, permutacin, combinacin.
Diferenciar los conceptos de probabilidad conjunta y probabilidad
condicional.
Calcular probabilidades en problemas tpicos.
Saber construir un diagrama de rbol como ayuda para l clculo e las
probabilidades.
Aplicar de manera correcta el teorema de Bayes.
Aplicar correctamente las tcnicas de conteo.

1. INTRODUCCIN.
En las unidades precedentes se trat sobre la estadstica descriptiva, es
decir, cmo organizar los datos de una muestra o poblacin y que tanto
estaban dispersos respecto a una medida de tendencia central.
La atencin se fija ahora en la estadstica inferencial. Esta se ocupa del
estudio de la posibilidad de que algo ocurra en el futuro. Esta rama de la
estadstica se encarga de obtener conclusiones de una poblacin a partir
de una muestra. Es claro que la toma de decisiones implica una cierta
incertidumbre, es decir, no se sabe si la decisin es la correcta; pero si
se puede saber la probabilidad que resulte confiable tal decisin. Es por
ello que la teora de las probabilidades constituye la base fundamental
para la estadstica inferencial.
La teora de probabilidad es una teora muy intricada y desarrollada para
describir los sucesos aleatorios. La palabra aleatorio proviene del
vocablo alea, el cual significa suerte o azar. Un fenmeno aleatorio es
aqul cuyo resultado est fuera de control y que depende del azar.
Qu tanta incertidumbre se tiene respecto a un fenmeno constituye la
probabilidad de ocurrencia de un evento. La palabra evento, suceso o
acontecimiento significan lo mismo y ms adelante se definir.

2. DEFINICIONES PREVIAS.
Para poder adelantarse al concepto de probabilidad se hace necesario
definir algunos conceptos importantes:
2.1. Experimento. Es un proceso que conduce a que ocurra una y slo
una de varias observaciones posibles. El experimento relativo a la
probabilidad no es algo que se hace en el laboratorio, es casi siempre
una actividad imaginaria. Los experimentos aleatorios cumplen las
siguientes caractersticas:
Se puede repetir las veces que el experimentador requiera, es decir
est sujeto a repeticin.
Su resultado es incierto, es decir, est fuera de control, depende del
azar.
Se puede anticipar la totalidad de los resultados posibles.
Se observa en l un patrn de regularidad que se hace ms evidente
a medida que aumentan las repeticiones.

Lanzar una moneda al aire es un experimento y las observaciones


posibles son que salga cara y que salga sello. Otro experimento
puede ser: el jugador de ftbol X ejecuta un tiro penal, las
observaciones posibles son que anote el gol y que erre el gol.
2.2. Evento. Un evento est relacionado con el azar, o sea, su
ocurrencia depende exclusivamente de este, es por esto que algunas
veces se le conoce como evento aleatorio. Se puede definir como el
conjunto de uno o ms resultados de un experimento. Para el jugador
que ejecuta el penal, un evento puede ser:
E1: marca el gol, otro puede ser:
E2: la pelota impacta en el travesao.
La unin de estos eventos es un evento:
E3= E1 E2: la pelota impacta en el travesao o marca gol.
La interseccin es otro evento:
E4= E1 E2: la pelota impacta en el travesao y marca gol.
En el experimento se lanza un dado se pueden tener los siguientes
eventos:
E1: que se obtenga un nmero par.
E2: que se obtenga un 2.
E3: que se obtenga un nmero par mayor que 2.
E3: que se obtenga un nmero impar.

Y se pueden describir una infinidad de eventos. Es posible que dos


eventos sucedan al tiempo; en el ejemplo del lanzamiento del dado, E1
y E2 pueden suceder al tiempo, es decir, se puede obtener un 2 y este
es un nmero par. Los eventos E1 y E3 no pueden ocurrir
simultneamente, ya que con un dado no se puede obtener un nmero
par y simultneamente un nmero impar.
2.2.1. Eventos mutuamente excluyentes. Son eventos en que la
ocurrencia de uno implica la no ocurrencia de los otros, es decir, son
eventos que no pueden ocurrir simultneamente. En el ejemplo del
prrafo anterior E1 y E3 son mutuamente excluyentes; pero E1 y E2 no
lo son.
2.3. Espacio muestral. Es un conjunto universal que enmarca todas
las posibles ocurrencias de un experimento aleatorio. Generalmente el
espacio muestral se denota por la letra S . Los elementos del espacio
muestral son eventos, as por ejemplo, si el experimento consiste en el
nacimiento de un beb, cuatro eventos podran ser:
E1: que el beb sea de sexo masculino.
E2: que el beb sea de sexo femenino.
E3: que el beb sea rubio.
E4: que el beb sea moreno.
El espacio muestral para este experimento es S1 = { E1, E 2, E 3, E 4} . En este
ejemplo el espacio muestral contiene, aparte de estos cuatro eventos
uniones o intersecciones de ellos, por ejemplo:
E5= E1 E4: que el beb sea de sexo masculino o que sea moreno.
E6= E2 E3: que el beb sea de sexo femenino y que sea rubio.
Estos eventos derivados de los cuatro primitivos hacen parte, en forma
tcita, del espacio muestral S y no se describen explcitamente slo
por comodidad.
La forma en que se defina un espacio muestral de un experimento
depender del problema que se enfrente. Por ejemplo, si en el
experimento del nacimiento del beb, slo nos interesa saber si es de
sexo masculino o de sexo femenino, entonces se utilizara el espacio
muestral S2 = { E1, E 2} . Es decir que se pueden utilizar diferentes espacios
muestrales para un experimento.

3. DEFINICIN DE PROBABILIDAD DE UN EVENTO.


La probabilidad es un concepto abstracto que se usa para describir el
grado de incertidumbre de un evento. La probabilidad es un nmero
entre cero y uno, inclusive que describe la posibilidad relativa de que
ocurra un evento. Si se denota la probabilidad de un evento con la letra
P , entonces 0 P 1 . Si la probabilidad es 0, entonces el evento es
imposible, si es 1, entonces el evento es seguro. Por ejemplo, cul es
la probabilidad de que una persona muera? Como es un evento seguro,
la probabilidad de que suceda es 1. Y cul es la probabilidad de que un
hombre salga embarazado? Hasta lo que va del desarrollo de la ciencia
parece que esto es imposible, por tanto la probabilidad de que suceda es
0.
Una probabilidad se puede expresar como una fraccin decimal, tal
como 0.23, 0.40 o 0.134. Tambin se puede expresar como un nmero
2 1
3
racional tal como
,
o
. De igual manera se puede expresar en
3 5
10
porcentaje as como 15% , 82% o 23.7% .
4. PUNTOS DE VISTA DE LA PROBABILIDAD.
El anlisis de las probabilidades se puede hacer desde distintos puntos
de vista: desde el punto de vista objetivo, que a su vez puede ser
clsico o emprico; y desde el punto de vista subjetivo. La figura 19
muestra un diagrama que esquematiza los puntos de vista de la
probabilidad.

Figura 19. Puntos de vista de la probabilidad.

4.1. Probabilidad objetiva. De manera intuitiva, se acostumbra a


considerar la probabilidad de un evento como un nmero. Este nmero
puede ser calculado de acuerdo con la proporcin de casos favorables o
de veces que ocurri un evento en un tiempo determinado.

4.1.1 Probabilidad Clsica. Se basa en la consideracin de que todos


los resultados de un experimento son igualmente posibles. La frmula
para
el
clculo
de
esta
probabilidad
es:
Nmero de resultados a favor del evento
P( E ) =
, donde P ( E ) es la probabilidad
Nmero de resultados posibles
de que ocurra el evento E.
Ejemplo 13. Se lanza un dado, cul es la probabilidad de que se
obtenga un nmero par mayor o igual a 4?
El experimento es: se lanza un dado.
El evento es E: que se obtenga un nmero par mayor o igual a 4
El espacio muestral es: S = {1, 2,3, 4,5, 6} .
Segn el espacio muestral hay 6 resultados posibles y hay 2 resultados
2 1
favorables al evento ( 4 y 6). Luego, P ( E ) = = .
6 3
Si se escribiera esta probabilidad en trminos decimales sera
P ( E ) = 0.333 y en trminos porcentuales, P ( E ) = 33.33% . Este nmero se
puede interpretar como: de cada 100 veces que realice el experimento,
aproximadamente el 33% de esas veces se obtendr un nmero par
mayor o igual a 4. No se puede garantizar lo que suceder en un
momento especfico, por ejemplo, no se puede saber en qu
lanzamiento suceder el evento, puede que sea en el primer
lanzamiento o en el cuarto, pero lo que si se puede decir es que cuanto
ms repeticiones se hagan, la proporcin de aciertos estar ms cercana
del 33%.
4.1.2. Probabilidad emprica. Se basa en las frecuencias relativas de
eventos que han sucedido en un tiempo pasado determinado. Se calcula
observando el nmero de veces en que el evento ocurri en un tiempo
determinado. La frmula par calcular este tipo de probabilidad es:
Nmero de veces en que ocurri el evento en el pasado
.
Nmero total de observaciones
Ejemplo 14. Un jugador de baloncesto ha ejecutado 15 tiros, de las
cuales ha encestado 10 veces. Cul es la probabilidad de que enceste
el prximo tiro?, cul es la probabilidad de que no enceste?
P( E ) =

Solucin.
Experimento: Lanzar un tiro.
Evento E1: que enceste.
Evento E2: que no enceste.

Espacio muestral: S = { E1, E 2} .


Segn el espacio muestral hay 2 resultados posibles. El nmero total de
observaciones es 15. El evento E1 ocurri 10 veces en el pasado y el
evento E2 ocurri 5 veces. Por tanto:
10
5
P ( E1) = = 0.67 y P ( E 2) = = 0.33 .
15
15
Note que los eventos E1 y E2 son mutuamente excluyentes y la suma de
sus probabilidades es 1.
Las probabilidades calculadas se interpretan: En los lanzamientos del
jugador el 67% de las veces encesta y el 33% de las veces falla. O dicho
de otro modo, el deportista tiene una efectividad del 67%.
4.2. Probabilidad subjetiva. Estas probabilidades se pueden
interpretar como evaluaciones personales o subjetivas. Se asignan de
acuerdo a cualquier informacin que se disponga con base en
suposiciones razonadas, intuicin u otras subjetividades. Por todo lo
anterior no existe una frmula para calcular la probabilidad subjetiva,
pues es un valor que se asigna de acuerdo a lo que se piensa, podra
ser. Ejemplos de este tipo de probabilidad son:
La probabilidad de que la seleccin colombiana de ftbol pase al
mundial de Alemania 2006 es 0.3. Este es un valor que es asignado
por un aficionado poco optimista.
La probabilidad de que la nota definitiva de la materia Estadstica sea
5.0 es 0.8. Muy seguramente este es un valor asignado por un buen
estudiante que adems es optimista.
5. REGLAS DE PROBABILIDAD.
Las reglas de la probabilidad son frmulas que se aplican a eventos que
son y no son mutuamente excluyentes.
5.1. Regla de la adicin. Si E1 y E2 son eventos (no importa si son o
no mutuamente excluyentes) entonces la probabilidad de que ocurra E1
o E2 est dada por la frmula: P ( E1 E 2) = P ( E1) + P ( E 2) P ( E1 E 2) . Se
utilizan los smbolos de unin ( ) e interseccin ( ) porque los eventos
son conjuntos. La unin se refiere a la disyuncin (o) y la interseccin a
la conjuncin (y). Si los eventos fueran mutuamente excluyentes,
entonces no pueden suceder al mismo tiempo, es decir, no podra
ocurrir E1 y E2, por tanto la probabilidad P ( E1 E 2) = 0 y la frmula de
la adicin quedara P ( E1 E 2) = P ( E1) + P ( E 2) .

La regla de la adicin se puede escribir para tres eventos, as:


P ( E1 E 2 E 3) = P ( E1) + P ( E 2) + P ( E 3) P ( E1 E 2) P ( E1 E 3) P ( E 2 E 3)
P ( E1 E 2 E 3)

Ejemplo 15. Un estudio en el pas revel que las personas del interior
que hacen turismo el 45% van Cartagena, 50% van a Santamarta, 40%
viajan a Barranquilla y el 35% van a Barranquilla y Santamarta. Cul
es la probabilidad de que un vacacionista visite al menos una de estas
ciudades?
Solucin.
La grfica de la figura 20 ilustra la situacin de este ejemplo.

Figura 20. Porcentaje de los viajeros del interior que visitan las ciudades de
Cartagena, Barranquilla y Santamarta.

Si se asignan los eventos:


E1: Viaja a Santamarta.
E2: Viaja a Cartagena.
E3: Viaja a Barranquilla.
Los porcentajes asignados a las intersecciones de cada evento, segn la
grfica de la figura 20, son:
E1 E2: A Santamarta y Cartagena viaja el 0%.
E1 E3: A Santamarta y Barranquilla viaja el 35%.
E2 E3: A Cartagena y Barranquilla viaja el 0%.
E1 E2 E3: A Santamarta, Cartagena y Barranquilla viaja el 0%.
E1: Slo a Santamarta viaja el 15%.
E2: Slo a Cartagena viaja el 45%.
E3: Slo a Barranquilla viaja el 5%.

Se pregunta por la probabilidad de visitar al menos una de estas


ciudades, es decir, P ( E1 E 2 E 3) . Al aplicar la regla de la adicin para
tres eventos, tenemos:
P ( E1 E 2 E 3) = P ( E1) + P ( E 2) + P ( E 3) P ( E1 E 2) P ( E1 E 3) P ( E 2 E 3)
P ( E1 E 2 E 3) = 0.15 + 0.45 + 0.05 0 0.35 0 0 = 0.3

Es decir que de cada 100 personas, 30 visitan por lo menos una de


estas ciudades.
5.2. Regla de la Multiplicacin. A veces la probabilidad de un evento
determinado depende de que otro evento se halla producido o no con
anterioridad. Es decir, en algunas ocasiones la aparicin de un evento
puede influir o no en la aparicin de otro, o bien que el otro se haga
ms o menos probable. Cuando la aparicin de un evento influye en la
probabilidad del otro, se dice que los dos eventos son dependientes, en
caso contrario se dice que los eventos son independientes.
Las probabilidades de eventos dependientes se les conoce como
probabilidades condicionadas. Se simbolizan P ( A / B ) y se leen: la
probabilidad de que se d el evento A dado que B ocurri.
La regla de la multiplicacin para dos eventos independientes se
enuncia: P ( E1 E 2) = P ( E1).P ( E 2) , Y en general para n eventos
independientes P ( E1 E 2 E 3 ... En) = P ( E1).P ( E 2).P ( E 3).....P ( En) Para dos
eventos dependientes se enuncia: P ( E1 E 2) = P ( E1 / E 2).P ( E 2) . Al
generalizar
para
n
eventos
dependientes:
P ( E1 E 2 E 3 ... En) = P( En / En 1,..., E 3, E 2, E1).....P ( E 3 / E 2, E1) P ( E 2 / E1) P ( E1)
El primer miembro de la derecha se lee: la probabilidad de que ocurra
el evento En , dado que ocurrieron En 1 ,, E 3 , E 2 y E1
Ejemplo 16. Un gorila sentado frente a un computador escribe una
palabra de 6 letras. Suponga que el teclado slo tiene 27 teclas
correspondientes a cada letra del abecedario y que el simio slo oprime
una tecla a la vez. Cul es la probabilidad de que el gorila escriba
GORILA?
Solucin.
Hay 6 evento los cuales son:
E1: Que escriba G.
E2: Que escriba O.
E3: Que escriba R.
E4: Que escriba I.

E5: Que escriba L.


E6: Que escriba A.
Estos eventos son dependientes, porque la probabilidad de que ocurra
uno influye en la de los dems, as el evento que escriba O est
afectado por el evento que escriba G para poder escribir
correctamente.
La probabilidad que se pregunta es P ( E1 E 2 E 3 E 4 E 5 E 6) , que
segn la regla de la regla de la multiplicacin para eventos dependientes
se
tiene:
P ( E1 E 2 E 3 E 4 E 5 E 6) = P ( E1).P ( E 2 / E1).P ( E 3 / E1, E 2).P ( E 4 / E1, E 2, E 3)
P ( E 5 / E 4, E 3, E 2, E1).P ( E 6 / E 5, E 4, E 3, E 2, E1)
1
Donde P ( E1) =
, es decir puede digitar 1 de 27 teclas. Y todas las
27
probabilidades en la frmula tienen el mismo valor. Entonces
1 1 1 1 1 1
1
P ( E1 E 2 E 3 E 4 E 5 E 6) =
. . . . .
= 6 = 2.59 * 10 9 .
27 27 27 27 27 27 27
Como se ve es una probabilidad muy pequea, casi cero. Por tanto no
es tan probable que un gorila escriba gorila frente a un computador.
5.3. Regla del complemento. La regla del complemento se utiliza para
determinar la probabilidad de que ocurra un evento restando del
nmero 1 la probabilidad de que un evento no ocurra.
Si P (E1) es la probabilidad del evento E1 y P (~ E1) es el complemento
de E1, es decir que no ocurra E1.
P (E1) + P (~ E1) = 1 y despejando se tiene: P (E1) = 1 - P (~ E1) o
tambin P (~ E1) = 1 - P (E1).
Ejemplo 17. De 45 estudiantes que asisten a una clase, 36 llegan
tarde. Cul es la probabilidad de que un estudiante llegue temprano?
Solucin.
Los eventos que intervienen son:
E1: El estudiante llega tarde.
~ E1: El estudiante no llega tarde (llega temprano).
36
La probabilidad del evento E1 es: P ( E1) =
= 0.8 . Por la regla del
45
complemento se obtiene que la probabilidad de un estudiante llegue
temprano es P (~E1)=1-P(E1)=1-0.8=0.2

6. DIAGRAMAS DE RBOL.
Es un instrumento til dentro de las probabilidades condicionales pues
permiten analizar la problemtica de los eventos cuando estos ocurren
uno despus del otro. Un rbol es un grfico que est constituido por
vrtices y ramas, cada rama parte de un vrtice que representa un
evento aleatorio diferente y la probabilidad de cada evento diferente se
anota sobre la rama que precede a cada evento de la manera en que se
indica en la figura 21.

Figura 21. Evento A y segmento que representa su probabilidad.

En el esquema que se presenta en la figura 22 se observa que la ramas


principales empiezan en el espacio muestral S y terminan en diferentes
eventos que son: A1 , A2 , A3 ,..., An . La siguiente rama termina en eventos
distintos, B1 , B2 , B3 ,..., Bn que se realizan despus de ocurrir A1 , as de
manera sucesiva pueden ocurrir eventos despus de cualquiera de ellos.
Despus del evento An ocurren los eventos C1 , C2 , C3 ,..., Cn . Tambin se
observa que cada evento forma un universo para los eventos siguientes,
por lo que la suma de las probabilidades en cada rama tendr que ser
igual a uno.
Ejemplo 18. Se lanza una moneda al aire. Si se obtiene cara, se saca
una balota de una urna A1 o A2 . Si cae sello se saca una balota de una
urna A3 o A4. La urna A1 contiene 10 balotas negras y 5 blancas, la
urna A2 contiene 8 balotas negras y 6 blancas, la urna A3 contiene 7
balotas negras y 2 blancas y la urna A4 contiene 9 balotas negras y 5
blancas. Cul es la probabilidad de sacar una balota negra?
Solucin.
Para responder a estas preguntas se construye el diagrama de rbol de
la figura 23.
Clculo de la probabilidad de sacar una balota negra: Se escogen todas
las ramas que conducen a la balota negra y se suman , luego para el
1 1 2 1 1 4 1 1 2 1 1 5 1 1 1 5
caso se tiene: P = * * + * * + * * + * * = + + +
= 0.09 .
2 2 3 2 2 7 2 2 9 2 2 14 6 7 18 56

Figura 22. Diagrama de rbol con un espacio muestral S, n ramas principales


por cada rama principal n, n ramas secundarias.

Figura 23. Diagrama de rbol correspondiente al ejemplo 18.

7. REGLA DE LA PROBABILIDAD TOTAL.


Se llama particin a un conjunto de sucesos Ei mutuamente excluyentes
de tal manera que la unin de todos ellos sea el espacio muestral S, en
trminos matemticos si E1 E 2 E 3 ... En = S y adems Ei Ej . La
figura 24 esquematiza una particin.

Figura 24. Particin del espacio muestral S, compuesta por los eventos
E1,E2,E3,,En.

La regla de la probabilidad total establece que si un conjunto de eventos


Ei forman una particin del espacio muestral S y si la probabilidad de
cada uno de estos eventos es diferente de ceros, es decir, P ( Ei ) 0, para
todo Ei , entonces para cualquier otro suceso B se cumple que
P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + ... + P ( B / En) P ( En) .
La
figura 25 ilustra esta regla.

Figura 25. Particin del espacio muestral S, compuesta por los eventos
E1,E2,E3,,En y el evento cualquiera B.

Demostracin:
El evento B es la interseccin de l con el espacio muestral, es decir,
B = B S ; pero el espacio muestral S es la unin de todos los evento
mutuamente excluyentes Ei , o sea, S = E1 E 2 E 3 ... En , por tanto el
evento B se puede escribir en trminos de los eventos Ei as:
B = B (E1 E 2 E 3 ... En ) = (B E1) (B E 2) (B E 3) ... (B En ) ,
luego P( B) = P((B E1) (B E 2) (B E 3) ... (B En )) . Como los eventos
Ei son mutuamente excluyentes, entonces los eventos B Ei tambin lo
son, por consiguiente de la regla de la adicin se tiene:
P( B) = P(B E1) + P(B E 2 ) + P(B E 3) + ... + P(B En ) y al aplicar la regla de
la multiplicacin a cada miembro de la derecha se obtiene
P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + ... + P ( B / En) P ( En) que es
la frmula de la probabilidad total.
Ejemplo 19.
En una institucin de educacin se ofrecen cuatro
carreras: Economa, Derecho, Sistemas e Idiomas. La distribucin de los
estudiantes por carrera es: Economa 28%, Derecho 20%, Sistemas
30% e Idiomas 22%. Segn un estudio acerca de las deserciones se
descubri que el porcentaje de estudiantes que finalizan sus estudios
son, respectivamente: en Economa el 85%, en Derecho el 72%, en
Sistemas el 90% y en Idiomas el 40%. Si se supone que el reglamento
de la institucin no permite que un estudiante curse dos carreras
simultneamente, cul es la probabilidad de que un estudiante elegido
al azar termine sus estudios?
Solucin.
La figura 26 muestra los eventos correspondientes para este ejemplo.

Figura 26. Eventos mutuamente excluyentes para el ejemplo 19.

Los eventos son:

E1: Estudiar Economa.


E2: Estudiar Derecho.
E3: Estudiar Sistemas.
E4: Estudiar Idiomas.
B: Finalizar estudios.
Segn
la
regla
de
la
probabilidad
total,
se
tiene:
P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + P ( B / E 4) P ( E 4)
donde:
P ( B / E1) = 0.85 , P ( B / E 2) = 0.72 , P ( B / E 3) = 0.90 , P ( B / E 4) = 0.40 , P ( E1) = 0.28 ,
P ( E 2) = 0.20 , P ( E 3) = 0.30 y P ( E 4) = 0.22 . Entonces la probabilidad de que
un
estudiante
elegido
al
azar
termine
sus
estudios
es:
P ( B ) = 0.85 * 0.28 + 0.72 * 0.20 + 0.90 * 0.30 + 0.40 * 0.22 = 0.74 .
8. TEOREMA DE BAYES.

El Teorema de BAYES se aplica en forma inversa al teorema de la


probabilidad total.
Como se vio en la seccin 7, el teorema de la probabilidad total
permite conocer la probabilidad de un evento a partir de las
probabilidades de otros sucesos. El teorema de Bayes permite
calcular la probabilidad de que suceda un evento sabiendo de
antemano que otro evento ocurri.
Por ejemplo, si se conocen las probabilidades de que los
estudiantes A, B y C cometan fraude en un examen. El profesor
tuvo que salir y encarg a otra persona a que vigilara el desarrollo
del examen. Cuando el profesor regresa, el vigilante le dice que
hubo un examen con fraude. Cul es la probabilidad de que el
fraude lo haya cometido el estudiante A? que lo haya cometido el
estudiante B? o qu lo haya cometido el estudiante D?. Como se
nota, se sabe de antemano que se dio el evento se cometi un
fraude y se pregunta por los eventos lo cometi A, lo cometi
B o lo cometi C.
Si los eventos Ei constituyen una particin del espacio muestral S y B es
un evento tal que su probabilidad no es cero, entonces la probabilidad
del evento Ei dado el evento B viene dado por la frmula:

P ( Ei / B ) =

P ( Ei ) P ( B / Ei )
P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + ... + P ( En) P ( B / En)

donde el denominador es la probabilidad total del evento B. Esta frmula


se puede escribir en forma ms compacta, as:
P ( Ei / B ) =

P ( Ei ) P ( B / Ei )
n

P( Ei) P( B / Ei)

i =1

Demostracin:
Segn la regla de la multiplicacin para dos eventos dependientes Ei y B
se tiene que P ( Ei B ) = P ( Ei / B ).P ( B ) . Al despejar se obtiene que
P ( Ei B )
P ( Ei / B ) =
, ahora como la interseccin de conjuntos es
P( B)
P ( B Ei )
conmutativa, se tiene P ( Ei / B ) =
y al aplicar de nuevo la regla
P( B)
de la multiplicacin al numerador y el teorema de la probabilidad total al
denominador , se obtiene:
P ( Ei ) P ( B / Ei )
P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + ... + P ( En) P ( B / En)
P ( Ei ) P ( B / Ei )
mejor P ( Ei / B ) = n
.
P( Ei) P( B / Ei)
P ( Ei / B ) =

i =1

Ejemplo 20. Segn un informe del IDEAM sobre las condiciones


ambientales del fin de semana en Bucaramanga. Las posibilidades que
se informaron son:
Solucin.

Llover: con probabilidad del 40%.


Que habr da soleado: con probabilidad del 50%.
Que habr da nublado sin lluvia: con probabilidad del 10%.

Las probabilidades de que haya accidentes de carros son:

Si llueve, la probabilidad es del 30%.


Si est soleado, la probabilidad es del 3%.
Si est nublado, la probabilidad es del 10%.

Se ha dado la noticia de que ocurri un accidente el sbado, pero por no


estar en la ciudad no se supo qu condiciones climticas haba. Cul es
la probabilidad de que ese sbado haya llovido?
Los eventos son:
E1: Estaba lloviendo.
E2: Estaba soleado.
E3: Estaba nublado sin lluvia.
B: Hubo un accidente.
Se pregunta por la probabilidad de que haya llovido dado que hubo un
accidente, es decir, P ( E1 / B ) . Todas las dems probabilidades son:
P ( E1) = 0.4, P ( E 2) = 0.5, P ( E 3) = 0.1, P ( B / E1) = 0.3, P ( B / E 2) = 0.03 y P ( B / E 3) = 0.1
Al aplicar la frmula del teorema de Bayes se obtiene:
P ( E1) P ( B / E1)
0.4 * 0.3
=
P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) 0.4 * 0.3 + 0.5 * 0.03 + 0.1 * 0.1
de donde se obtiene P ( E1 / B ) = 0.82
P ( E1 / B ) =

9. PRINCIPIOS DE CONTEO.
Si el nmero de resultados posibles de un experimento es relativamente
pequeo, resulta fcil contarlos, por ejemplo al lanzar una moneda al
aire hay dos posibilidades y contar hasta dos resulta muy trivial. Pero si
por ejemplo se quiere contar el nmero de placas para carros que hay
proyectadas en Colombia resultara muy tedioso. Por tanto si se tuviese
tcnicas para contar de manera ms fcil, el trabajo sera ms
provechoso.
Esencialmente existen tres frmulas que permiten facilitar el
procedimiento de conteo de grandes cantidades de objetos, individuos o
eventos.
9.1. Principio aditivo de conteo. Sean E1y E2 dos eventos
mutuamente excluyentes. Si E1 ocurre de m maneras distintas y E2
ocurre de n maneras distintas, entonces el nmero de maneras en que
pueden ocurrir ambas es n + m.

El ejemplo que ilustra este principio se esquematiza en la figura 27. Si


se quiere ir de la ciudad A a la ciudad B existen los caminos r, s, t, u y
v, que no se pueden recorrer simultneamente, es decir, hay 5 maneras
de ir de A a B.

Figura 27. Caminos posibles para ir de la ciudad A a la ciudad B.

Ejemplo 21. Un chef de un distinguido restaurante quiere preparar una


langosta. l cuenta con varias maneras de prepararla: 3 maneras de
prepararla cocida, 8 maneras de prepararla al ajillo, 4 maneras de
prepararla en salsa y 2 maneras de prepararla en sopa. De cuntas
maneras puede el chef preparar su langosta?
Solucin.
Las formas de preparar la langosta son mutuamente excluyentes, ya
que si la prepara cocida, no la prepara al ajillo y as sucesivamente. De
acuerdo con el principio aditivo se tienen 3+8+4+2=17 maneras de
preparar la langosta.
9.2. Principio multiplicativo de conteo. Si un evento E1 puede
ocurrir de n maneras e, independientemente, un segundo evento puede
ocurrir de m maneras, entonces el nmero de maneras en que ambos,
E1 y E2, pueden ocurrir es mn.
A este principio tambin se le denomina principio fundamental de
conteo. El ejemplo que ilustra este principio se muestra en la figura 28.
Si hay tres formas para ir de A a B mediante los caminos r, s, y t y hay
4 formas para ir de B a C mediante los caminos u, v, w y x, entonces
hay 3*4=12 maneras para ir de A a C.

Figura 28. Caminos posibles para ir de A a C.

Los caminos en forma explcita son: Aru, Arv, Arw, Arx, Asu, Asv, Asw,
Asx, Atu, Atv, Atw y Atx. Se nota entonces que el principio multiplicativo
facilita el conteo.
Ejemplo 22. Un nio en una fiesta de cumpleaos puede escoger entre
tres helados: vainilla, fresa y ron con pasas; puede escoger entre dos
tipos de galletas: de leche y de chocolate y adems puede escoger entre
tres sabores de gaseosa: uva, naranja y manzana. De cuntas maneras
puede un nio escoger su merienda en la fiesta, suponiendo que come
helado y galleta y toma gaseosa.
Solucin.
Como un nio no puede tomar ms de un helado, galleta o gaseosa,
entonces de acuerdo al principio multiplicativo, un nio puede comer de
3x2x3=18 formas de merienda.
En forma explcita, estas formas son:
1.
Helado
2.
Helado
3.
Helado
4.
Helado
5.
Helado
6.
Helado
7.
Helado
8.
Helado
9.
Helado
10. Helado
11. Helado
12. Helado
13. Helado
14. Helado
naranja.
15. Helado
manzana.
16. Helado
uva.
17. Helado
naranja.
18. Helado
manzana.

de vainilla, galleta de leche y gaseosa sabor a uva.


de vainilla, galleta de leche y gaseosa sabor a naranja.
de vainilla, galleta de leche y gaseosa sabor a manzana.
de vainilla, galleta de chocolate y gaseosa sabor a uva.
de vainilla, galleta de chocolate gaseosa sabor a naranja.
de vainilla, galleta de chocolate gaseosa sabor a manzana.
de fresa, galleta de leche y gaseosa sabor a uva.
de fresa, galleta de leche y gaseosa sabor a naranja.
de fresa, galleta de leche y gaseosa sabor a manzana.
de fresa, galleta de chocolate y gaseosa sabor a uva.
de fresa, galleta de chocolate gaseosa sabor a naranja.
de fresa, galleta de chocolate gaseosa sabor a manzana.
de ron con pasas, galleta de leche y gaseosa sabor a uva.
de ron con pasas, galleta de leche y gaseosa sabor a
de ron con pasas, galleta de leche y gaseosa sabor a
de ron con pasas, galleta de chocolate y gaseosa sabor a
de ron con pasas, galleta de chocolate gaseosa sabor a
de ron con pasas, galleta de chocolate gaseosa sabor a

Antes de definir las permutaciones y combinaciones se hace necesario


definir el factorial de un entero no negativo.

Factorial de un entero no negativo. Para todo entero no


negativo n, su factorial es el producto de todos los enteros entre 1 y n.
El factorial de n se simboliza n ! . La forma matemtica del factorial es
n != 1 * 2 * 3 * ... * (n 1) * n . Se define el factorial de cero como uno, es decir
0!= 1 . Por ejemplo, 3!= 1 * 2 * 3 = 6 y 4!= 1 * 2 * 3 * 4 = 24 . Note que
n != 1 * 2 * 3 * ... * (n 1) * n = (n 1)!*n

9.3. Permutaciones. Una permutacin de un conjunto de objetos es


un arreglo en un orden definido y sin repeticin de todos o parte de
ellos. Por ejemplo si tomamos las letras S, A, B, E, se pueden formar las
permutaciones: SABE, SAEB, SBAE, SBEA, SEAB, SEBA, ASBE, ASEB,
ABSE, ABES, AESB, AEBS, BASE, BAES, BSAE, BSEA, BESA, BEAS,
EASB, EABS, ESAB, ESBA, EBSA, EBAS y EBSA. Note que AABB no es
una permutacin ya que no se permiten repeticiones. Si en lugar de
tomar todos los elementos del conjunto se hubieran tomado grupos de
tres para permutarlos, entonces tambin salen 24 permutaciones: ABE,
AEB, BEA, BAE, EAB, EBA, ABS, ASB, BAS, BSA, SAB, SBA, BES, BSE,
ESB, EBS, SBE, SEB, ASE, AES, SAE, SEA, ESA, EAS. Si se toman
grupos de dos elementos del conjunto para permutarlos se formaran 12
permutaciones: AS, SA, AB, BA, AE, EA, BS, SB, BE, EB, SE y ES. Si se
tomara un solo elemento del conjunto entonces se formaran cuatro
permutaciones: S, A, B y E.
La frmula para calcular el nmero de permutaciones que se obtienen al
n!
escoger r elementos de un conjunto de n elementos es: n Pr =
(n r )!
donde el smbolo n Pr se lee n permutado r. Existen muchas
nomenclaturas diferentes para simbolizar las permutaciones como son:
P (n, r ) , Pnr (n) r , Onr entre otras. Si se aplica la frmula para el ejemplo en
consideracin, se tiene:

4!
4! 4!
= = = 4!= 24 .
(4 4)! 0! 1
4!
4!
Permutaciones con grupos de tres letras: 4 P3 =
= = 4!= 24 .
(4 3)! 1!
4!
4! 2!*3 * 4
Permutaciones con grupos de dos letras: 4 P2 =
= =
= 12!.
(4 2)! 2!
2!

Permutaciones con las cuatro letras: 4 P4 =

Permutaciones con grupos de una letra: 4 P1 =

4!
4! 3!*4
= =
= 4.
(4 1)! 3! 3!

Se nota que si se toman todos los elementos para permutarlos,


entonces r = n y las permutaciones que se obtendran son n ! .
Ejemplo 22. Unos turistas viajan de vacaciones en una caravana de
siete carros. Se requiere que tres de esos carros especficos siempre
vayan juntos en fila. Cuntos arreglos de carros son posibles en la
caravana?
Solucin.
La figura 29 ilustra la situacin. Se considera que los tres carros forman
un elemento, por tanto se puede considerar que hay cinco elementos: 4
carros y un conjunto de 3. Segn al frmula de la permutacin, el
nmero de permutaciones que se pueden obtener con estos cuatro
elementos es 4! =24. Ahora, el grupo de los tres carros tambin puede
permutar y se sigue cumpliendo la condicin de que van juntos. De
nuevo, segn la frmula de las permutaciones, se pueden obtener 3! =6
permutaciones. Ahora de acuerdo con el principio multiplicativo, se
obtienen 24x6=144 arreglos de carros en la caravana.

Figura 29. Carros que viajan en caravana turstica.

9.4. Combinaciones. Los arreglos de n elementos donde se toman


grupos de r elementos en los cuales el orden no es importante se les
llama combinaciones. Por ejemplo con las letras S, A, B y E slo se
puede hacer una combinacin con los cuatro elementos: SABE, pues
esta es esencialmente igual a BASE y a SEBA pues el orden no es
importante. Caso contrario ocurra en las permutaciones ya que la
permutacin SABE y BASE eran diferentes, pues el orden si era
importante. Las combinaciones que se pueden hacer con grupos de 3
letras es 4: SAB, SAE, ESB y EAB. Las combinaciones que se pueden
hacer con grupos de 2 letras son 6: AS, AB, AE, SE, SB y EB. Las
combinaciones que se pueden hacer con grupos de 1 letra son 4: S, A, B
y E.

La frmula para el clculo de las combinaciones de r elementos de un


n!
grupo de n es n Cr =
, donde el smbolo n Cr se lee n combinado
r !(n r )!
n
r. Las notaciones ms usuales para las combinaciones son: , C (n, r ) ,
r
Cnr , entre otras.

Ejemplo 23. Para una entrevista de trabajo, el siclogo de recursos


humanos quiere seleccionar grupos de 5 de un total de 12 aspirantes.
Cuntos grupos diferentes puede formar?
Solucin.
Claramente se est preguntando por combinaciones pues no se requiere
orden de llamado. Al aplicar la frmula de la combinacin se obtiene
12!
12!
7!*8 * 9 * 10 * 11 * 12 8 * 9 * 10 * 11 * 12
=
=
=
= 4 * 9 * 2 * 11 = 792 .
12 C5 =
5!(12 5)! 5!*7!
5!*7 !
1* 2 * 3 * 4 * 5
Ejemplo 24. Suponga que en un refrigerador hay 20 gaseosas, 30
cervezas, 25 botellas con agua y 40 jugos. Suponga que una persona
saca 15 botellas. Cul es la probabilidad de que se saquen 6 cervezas,
3 jugos, 4 gaseosas y 2 botellas de agua?
Solucin.
Se deben contar los resultados favorables. Se trata de combinaciones, y
se pueden sacar:

6 de 30 cervezas, es decir,

30!
30!
24!*25 * 26 * 27 * 28 * 29 * 30
=
=
= 593775 formas de sacar
6!(30 6)! 6!*24!
1 * 2 * 3 * 4 * 5 * 6 * 24!
grupos de 6 cervezas.
30

C6 =

3 de 40 jugos, es decir,

40!
40!
37 !*38 * 39 * 40
=
=
= 9880 formas de sacar grupos de 3
3!(40 3)! 3!*37 !
1 * 2 * 3 * 37 !
jugos.
40

C3 =

4 de 20 gaseosas, es decir,

20!
20!
16!*17 * 18 * 19 * 20
=
=
= 4845 formas de sacar grupos
4!(20 4)! 4!*16!
1 * 2 * 3 * 4 * 16!
de 4 gaseosas.
20

C4 =

2 de 25 botellas de agua, es decir,

25!
25!
23!*24 * 25
=
=
= 300 formas de sacar grupos de 2
2!(25 2)! 2!*23!
1 * 2 * 23!
botellas de agua.
25

C2 =

Los casos totales resultan de sacar 15 botellas de 115 que hay en el


refrigerador, luego los casos totales tambin es una combinacin:

115

C15 =

115!
115!
100!*101 * 102 * 103 * ... * 115
=
=
= 2.39 * 1018 .
15!(115 15)! 15!*100!
15!*100!

Entonces los casos favorables son:593775+9880+4845+300=608800.


608800
Por tanto la probabilidad es P =
= 2.5 * 1013 que es una
18
2.39 * 10
probabilidad extremadamente pequea. Es decir, no es tan probable que
se saquen las botellas como se indica.
10.

EJERCICIOS DE LA UNIDAD.

10.1. Una urna contiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae


una bola al azar. Determina la probabilidad de que:
a) Sea roja, b) Sea amarilla, c) Sea verde, d) No sea roja, e) Sea roja o
verde, f) No sea verde, g) Sea roja, verde o amarilla.
10.2. Se lanzan tres monedas al aire. Calcula la probabilidad de que: a)
haya al menos una cara, b) hayan al menos dos caras, c) hayan caras o
cruces.
10.3. Sean A y B dos sucesos aleatorios de un espacio muestral, tal que
p(A) = 3/8, p(B) = 1/2 y p(A B) = 1/4. Se pide: a) p(A B), b) p(A), c)
p(B).
10.4. Halle la probabilidad de que la suma de los puntos de las caras
visibles de un dado que se lanza al azar sea mltiplo de 5.
10.5. En una bolsa hay 50 bolas numeradas del 1 al 50. a) Cul es la
probabilidad de sacar una bola cuyo nmero sea mltiplo de 2? b) Y
mltiplo de 5?

10.6. Se tiene una urna compuesta por 20 bolas rojas y 15 blancas. Se


extraen con reemplazo dos bolas al azar. a) Halla la probabilidad de que
ambas sean rojas. b) Halla la probabilidad de que una sea roja y la otra
blanca.
10.7. La probabilidad de que un hombre viva dentro de 30 aos es de
1/5 y la probabilidad de que su mujer viva transcurridos 30 aos es 3/7.
Pasados 30 aos hallar:
a) Probabilidad de que vivan ambos
b) Probabilidad de que slo viva la mujer
c) Probabilidad de que slo viva el hombre
d) Probabilidad de que no viva ninguno de los dos.
10.8. El 60% de los habitantes de una ciudad lee el peridico A; el 45%,
el B y el 20% ambos. Qu porcentaje no lee ninguno?
10.9. Segn el IDEAM, en Bucaramanga hay una probabilidad 0,4 de
que haga fro; 0,6 de que llueva o haga fro y 0,1 de que llueva y haga
fro. Cul es la probabilidad de que se moje si sale a la calle sin
paraguas?
10.10. Halle la probabilidad de que al lanzar tres dados se obtenga una
suma inferior a 17.
10.11. En una clase hay 10 alumnas rubias, 20 morenas, 5 alumnos
rubios y 10 morenos.
Un da slo asisten 44. Calclese la probabilidad de que la persona que
falte sea: a) hombre, b) mujer, c) hombre rubio, d) mujer morena, e)
hombre moreno o mujer rubia, f) hombre rubio o mujer morena, g)
hombre o mujer, h) persona pelirroja.

UNIDAD V DISTRIBUCIONES DE PROBABILIDAD.


OBJETIVO GENERAL.
Comprender el concepto de distribucin
importancia en la estadstica inferencial.

de

probabilidad

su

OBJETIVOS ESPECFICOS.

1.

Definir distribucin de probabilidad y variable aleatoria.


Diferenciar entre distribucin de probabilidad discreta y distribucin
de probabilidad continua.
Calcular la varianza, la desviacin estndar y la media en una
distribucin e probabilidad.
Identificar las distribuciones de probabilidad ms comunes.
Aplicar la distribucin normal.
INTRODUCCIN.

Una distribucin de probabilidad hace referencia a toda una gama de


probabilidades de los eventos de en un experimento y muestra que tan
probable es un evento futuro, relacionado con dicho experimento. Se
puede concebir como una distribucin terica de frecuencias, es decir,
una distribucin que describe cmo se espera que varen las
probabilidades para experimento dado. Las distribuciones de frecuencia
son modelos de gran utilidad, pues ayudan mucho en las inferencias y
en la toma de decisiones en condiciones de incertidumbre
2.

DEFINICIN.

Una distribucin de probabilidad es un modelo matemtico que organiza


los eventos posibles de un experimento y que le asocia su probabilidad
correspondiente. Para una mejor comprensin de este concepto vase el
ejemplo 25.
Ejemplo 25. Se seleccionan al azar dos esferas de una caja donde hay
5 blancas y tres negras Cul es la distribucin de probabilidades de
este experimento?
Solucin.
Dado que se puede sacar una esfera blanca seguida de una negra o una
blanca, o primero una esfera negra seguida de una negra o blanca,
entonces el espacio muestral es: S = {BB, BN .NB, NN } . Los eventos son:

E1: Sacar una esfera blanca y luego una blanca (BB).


E2: Sacar una esfera blanca y luego una negra (BN).
E3: Sacar una esfera negra y luego una blanca (NB).
E4: Sacar una esfera negra y luego una negra (NN).
Las probabilidades de cada evento se calculan con la ayuda del
diagrama de rbol de la figura 30.

Figura 30. Diagrama de rbol para las probabilidades de sacar dos esferas en
el ejemplo 25.

5 4 20 5
5 3 15
* =
=
,
P ( E 2) = * =
,
8 7 56 14
8 7 56
3 5 15
3 2
6
3
P ( E 3) = * =
y P ( E 4) = * =
=
. Al resumir estas probabilidades
8 7 56
8 7 56 28
con sus eventos se obtiene una distribucin de probabilidades como se
muestra en la tabla 19.

Las

probabilidades

Evento

son: P ( E1) =

Probabilidad

Nmero de blancas

Nmeros de negras

5
2
0
14
15
E2
1
1
56
15
1
1
E3
56
3
E4
0
2
28
Tabla 19. Distribucin de probabilidades para el ejemplo 25.
E1

Es de notar que la suma de las probabilidades de una distribucin de


frecuencias es igual a 1.
3.

VARIABLE ALEATORIA.

Los eventos de un experimento aleatorio se pueden contar. Se puede


definir una funcin que cuente los resultados de los eventos posibles de
un experimento. Si en el ejemplo 25 se quisiera contar el nmero de
esferas negras, es decir, definir el evento que salga esfera negra,
entonces se utiliza la variable aleatoria X as:
X = 0, hay cero esferas negras.
X = 1, hay una esfera negra.
X = 2, hay dos esferas negras.
El diagrama de Venn para esta variable aleatoria se puede observar en
la figura 31.

Figura31. Diagrama de Venn para la variable aleatoria que cuenta el nmero


de esferas negras en el ejemplo 25.

Note que la variable aleatoria es una funcin que asocia un nmero


real, perfectamente definido, a cada resultado posible de un
experimento. La tabla 19 se puede rescribir para la variable aleatoria en
mencin para as obtener la tabla 20, que es en s una distribucin de
probabilidades.
Evento

Probabilidad

5
0
14
15
BN
1
56
15
NB
1
56
3
NN
2
28
Tabla 20. Distribucin de probabilidades y variable aleatoria que cuenta las
esferas negras en el ejemplo 25.
BB

De la tabla 20 se puede calcular, por ejemplo, la probabilidad de que la


3
variable aleatoria X tenga un valor de 2, as P ( X = 2) =
.
28
De lo anterior se puede deducir que las probabilidades son funciones de
las variables aleatorias. Por esta razn es que a las distribuciones de
probabilidad se les conoce como funciones de densidad de
probabilidad (fdp). Una fdp asocia a cada valor de una variable
aleatoria una probabilidad.
Para el ejemplo 25 se puede obtener la grfica de la distribucin de
frecuencias en funcin de la variable aleatoria que cuenta las esferas
negras, es decir, la grfica de la funcin de densidad de probabilidad.
Esta grfica se muestra en la figura 32.
Las variables aleatorias pueden ser discretas o continuas. Son discretas
cuando slo pueden tomar valores especficos separados, por ejemplo la
variable que cuenta el nmero de caras que se obtienen cuando se
lanzan tres monedas al aire.
Las variables aleatorias continuas son las que pueden tomar un valor de
una cantidad infinitamente grande de valores. Los conceptos de discreto
y continuo se explicaron en el apartado 5.2. de la primera unidad.
Cuando la variable aleatoria es discreta, entonces se obtiene una
distribucin de probabilidad discreta y cuando la variable aleatoria es
continua se obtiene una distribucin de probabilidad continua. La figura
32 es un ejemplo de una distribucin de probabilidad discreta.

Figura 32. Grfica de la distribucin de probabilidades o funcin de densidad


de probabilidad de la variable aleatoria que cuenta el nmero de esferas
negras en el ejemplo 25.

4.

DISTRIBUCIN DE PROBABILIDAD DISCRETA.

Como se mencion en un prrafo arriba, la distribucin de probabilidad


discreta nace de una variable aleatoria discreta. Existen varios tipos
especiales de esta clase de distribuciones tales como la distribucin
binomial, la distribucin geomtrica, la distribucin de Poisson, entre
otras.
4.1. Funcin de distribucin acumulativa. Hay muchos problemas
en que es de inters conocer la probabilidad de que el valor de una
variable aleatoria sea menor o igual a un nmero real a . Se puede
escribir, por consiguiente, la probabilidad de que la variable aleatoria X
tome valores menores o iguales que a como la funcin F tal que
F ( X ) = P ( X a ) . A esta funcin se le conoce como funcin de distribucin
acumulativa o simplemente funcin de distribucin de la variable
aleatoria X. Matemticamente esta funcin se define por:
n

Si X es una variable aleatoria discreta, F ( X ) = P ( X a ) = P ( X ) , es decir


i<a

la funcin de distribucin acumulativa es la suma de todas las


probabilidades que estn por debajo de la probabilidad de que la
variable aleatoria tome el valor de a . Para el ejemplo 25 la tabla 21
muestra los valores de la funcin distribucin acumulativa de la variable
aleatoria X que cuenta el nmero de esferas negras. La grfica de esta
funcin se muestra en la figura 33.

P(X)

F(X)

5
5
14
14
35
15
1
56
56
50
15
1
56
56
3
56
2
=1
28
56
Tabla 21. funcin de distribucin de la variable aleatoria X que cuenta el
nmero de esferas negras del ejemplo 25.
0

Figura 33. Grfica de la funcin de distribucin de la variable aleatoria X que


cuenta el nmero de esferas negras del ejemplo 25.

Si se quisiera calcular la probabilidad de que el nmero de esferas


negras sea menor que dos, entonces se mira en la grfica y se suman
las probabilidades correspondientes a los valores de la variable aleatoria
50
menor que dos, es decir,
0.9 .Es de notar que se toma la
56
probabilidad para X = 1 en la grfica 33, puesto que en ese valor ya
est sumada (acumulada) la probabilidad de X = 0.
4.2. Media, varianza y desviacin estndar de una distribucin
de probabilidades discreta. Al igual que en las distribuciones de
frecuencias, en las distribuciones de probabilidad se pueden calcular la
media, como una medida de tendencia central; la desviacin estndar y
la varianza como medidas de dispersin.

La Media. Es un valor tpico que representa a la distribucin de


probabilidad. Se simboliza por y viene dada por: = X P ( X ) , donde
x

P ( X ) es la probabilidad de que la variable aleatoria X tome un valor


entre x real. Algunas veces se habla del valor esperado de una variable
aleatoria E ( X ) en vez de la media de la distribucin. Los significados son
idnticos.

La Varianza. Como se ha visto en unidades anteriores la Varianza


es una medida que muestra la dispersin de los datos. En el caso de las
distribuciones de probabilidad la varianza 2 se calcula mediante la
2
frmula 2 = ( X ) P ( X ) .

La desviacin estndar. Es la raz cuadrada de la varianza, se

simboliza por y viene dada por la frmula =

[( X ) P( X )] .
2

Ejemplo 26. Un inversionista dispone de 1000 millones de pesos par


invertirlos en un ao. l est indeciso y tiene dos opciones: invertir en
la bolsa de valores, lo que le garantiza una ganancia fija del 15% o
hacer un plan de inversin cuya ganancia anual puede considerarse
como una variable aleatoria cuyos valores dependen de las condiciones
econmicas que prevalezcan. Para la segunda opcin se sabe que de
acuerdo a un anlisis estadstico se pudo determinar los posibles valores
de la ganancia y sus probabilidades, tal como aparecen en la tabla 22.
Calcule el valor esperado, la varianza y la desviacin estndar.
Ganancia (%)
40
20
18
15
10
3

Probabilidad
0.15
0.15
0.35
0.18
0.13
0.04

Tabla 22. Ganancias con sus respectivas probabilidades para el segundo plan
de inversin.

Solucin.
La
media
de
esta
distribucin
es:
= 40 * 0.15 + 20 * 0.15 + 18 * 0.35 + 15 * 0.18 + 10 * 0.13 + 3 * 0.04 = 19.42% . Este valor
indica que si se toma la segunda opcin se esperara ganar el 19.42%
de la inversin, esto es, la ganancia esperada ser del 19.42%.
Para el clculo de la desviacin estndar y varianza se utiliza,
sistemticamente, la tabla 23.
X (%)

P( X )

( X )2

40
20
18
15
10
3

0.15
0.15
0.35
0.18
0.13
0.04

20.58
0.58
-1.42
-4.42
-9.42
-16.42

423.5364
0.3364
2.0164
19.5364
88.7364
269.6164

( X )2 P ( X )
63.5305
0.0505
0.7057
3.5166
11.5357
10.7847
2
= 90.1237

Tabla 23. Clculo sistematizado de la varianza del ejemplo 26.

Luego la varianza es 2 = 90.1237 y la desviacin estndar = 9.49%.


Esto significa que la ganancia ms pequea que se puede tener es de
19.42-9.49=9.92%.
Si toma la primera opcin obtendr una ganancia fija del 15%; pero si
toma el segundo plan se esperara obtener una ganancia del 19.42%
con una variacin del 9.49%. Qu decisin tomara usted?
4.3. La distribucin binomial. Esta es un tipo de distribucin de
probabilidad. Una distribucin de probabilidades binomial se da cuando
la variable aleatoria es binomial. Para que una distribucin de
probabilidad sea binomial se debe cumplir:
Debe haber dos resultados posibles en cada ensayo de un
experimento. Por ejemplo al lanzar una moneda, los resultados posibles
son obtener cara u obtener sello. Generalmente los resultados se
clasifican como xito o fracaso.
Los resultados del experimento deben ser mutuamente excluyentes.
Al lanzar el dado puede salir cara o sello pero no los dos a la vez, por
tanto estos resultados son mutuamente excluyentes.
La variable aleatoria debe contar slo el nmero de xitos en una
cantidad finita de ensayos. Por ejemplo si se lanza la moneda 3 veces, el
evento es que se obtenga cara y en el primer lanzamiento se obtuvo y
en los otros dos no, entonces la variable aleatoria tiene los valores: 1, 0,
0.
La probabilidad de xito de un ensayo a otro permanece constante.
Por ejemplo al lanzar por primera vez la moneda (primer ensayo) la
probabilidad de que se obtuviera cara es de 0.5, al volver a lanzar la
moneda (segundo ensayo) la probabilidad de que se obtuviera cara es
tambin 0.5 y as para todos los lanzamientos que se hagan (finitos) la
probabilidad permanece constante (0.5)
Los ensayos deben ser independientes, es decir la ocurrencia de un
resultado de un ensayo no afecta al prximo ensayo. Por ejemplo, si en
el primer lanzamiento de la moneda se obtiene cara, este resultado no
incide en el lanzamiento de la moneda por segunda vez.
La distribucin de probabilidad o la funcin de probabilidad (funcin de
densidad de probabilidad) para una distribucin binomial viene dada por
n
n x
P ( X ) = p x (1 p ) , donde p es la probabilidad de xito en cada ensayo,
x

n
x es el nmero de xitos, n es el nmero de cada ensayo y es la
x
combinatoria ya definida.

4.3.1. Media de una distribucin de probabilidad binomial. La


media viene dada por = np , donde n es el nmero de ensayos y p es
la probabilidad de xito de cada ensayo.
4.3.2. Desviacin estndar de una distribucin de probabilidad
binomial. La desviacin estndar viene dada por = np(1 p) .
4.3.3. Uso de tablas en la distribucin binomial. La distribucin
binomial se encuentra tabulada, por lo que es relativamente sencillo
calcular las probabilidades en esta distribucin sin necesidad de aplicar
la frmula. Para usar las tablas de distribucin binomial se hace
necesario conocer:

El nmero de veces que se realiza el experimento: n .


La probabilidad de xito: p .
El nmero de xitos: x .

Ejemplo 27. Una mquina fabrica una determinada pieza y se sabe que
de cada 200 piezas que produce, 20 son defectuosas. Encuentre la
probabilidad de que al examinar 17 piezas salgan 3 defectuosas.
Solucin.
Es claro que este problema corresponde a una distribucin binomial,
porque la probabilidad siempre es la misma (por cada 200 piezas que se
fabrican salen 20 defectuosas), una pieza no puede ser defectuosa y no
defectuosa a la vez y hay dos posibles resultados: xito para la pieza
defectuosa y fracaso para la pieza no defectuosa. Note que el xito se
refiere al resultado por el cul se indaga. Si la pregunta hubiese sido en
el sentido de la probabilidad de que haya una pieza no defectuosa,
entonces el xito sera no defectuosa y el fracaso defectuosa. Los
elementos de la frmula para el clculo e la probabilidad son:
20
n = 17 ,
p=
= 0 .1
y
x = 3.
Por
tanto
200
17
17 3
P (3) = 0.13 (1 0.1)
= 680 * 0.001 * 0.914 = 0.1555 .
3

Este resultado se habra podido obtener mediante el uso de la tabla para
la distribucin binomial acumulada, que se encuentra en el anexo. En la
tabla 24 se muestra un fragmento de dicha tabla.

Tabla 24. Tabla de distribuciones de probabilidad binomial acumuladas para n


=17 varios valores de p.

Note que al tomar el valor de n = 17, x = 3 y la probabilidad de 0.1 se


obtiene la probabilidad acumulada de 0.9174. Al hacer la diferencia
entre esta probabilidad y la probabilidad anterior 0.7618 para x = 2, se
obtiene 0.9174-0.7618 = 0.1556 que es la probabilidad obtenida por la
frmula. En algunos libros vienen tablas de distribuciones de
probabilidades no acumuladas, luego los valores calculados por la
frmula se leen directamente sin necesidad de hacer diferencias.
Si la pregunta hubiese sido cul es la probabilidad de que al tomar 17
piezas salgan tres o menos piezas defectuosas? La respuesta podra
conseguirse mediante la frmula o mediante la tabla 24. As:
P ( X 3) = P (0) + P (1) + P (2) + P (3) , donde:
17
17
P (0) = 0.10 (1 0.1) = 1 * 1 * 0.917 = 0.1667
0
17
17 1
P (1) = 0.11 (1 0.1) = 17 * 0.1 * 0.916 = 0.3150
1
17
17 2
P (2) = 0.12 (1 0.1)
= 136 * 0.01 * 0.915 = 0.2800
2

17
17 3
P (3) = 0.13 (1 0.1)
= 680 * 0.001 * 0.914 = 0.1555 , por tanto la probabilidad
3
sera:

P ( X 3) = P (0) + P (1) + P (2) + P (3) = 0.1667 + 0.3150 + 0.2800 + 0.1555 = 0.9172 , que
es el valor que se puede leer directamente de la tabla 24. La diferencia
est en que no se tuvieron en cuenta todos los decimales al momento
del clculo.

La distribucin para estas tres probabilidades se muestra en la tabla 25


cuya grfica se muestra en la figura 34. La grfica de la distribucin
binomial acumulada se muestra en la figura 35.
Nmero de piezas defectuosas

Probabilidad

0
1
2
3

0.1667
0.3150
0.2800
0.1555

Tabla 25. Distribucin de probabilidad binomial para el ejemplo 27 para un


nmero de piezas defectuosas entre cero y tres.

Figura 34. Grfica de la distribucin binomial del ejemplo 27 para un nmero


de piezas defectuosas entre cero y tres.

Figura 35. Grfica de la distribucin binomial acumulada del ejemplo 27 para


un nmero de piezas defectuosas entre cero y tres.

La media para esta distribucin es = 17 * 0.1 = 1.7 , es decir que de 17


piezas que se tomen al azar, se espera encontrar 1.7 defectuosas.
La desviacin estndar es = 17 * 0.1(1 0.1) = 1.23 piezas, es decir que el
mximo de piezas defectuosas que puede obtener en 17 piezas es de
1.7+1.23=2.93 piezas y el mnimo de 1.7-1.23=0.47.
Es obvio que los nmero no enteros no representan nmero de piezas,
pero la informacin es valiosa al momento de evaluar el procedimiento.
4.4. La distribucin de Poisson. La caracterstica de la distribucin
de probabilidades de Poisson es que la variable aleatoria asume slo
valores enteros no negativos, es decir, 0, 1, 2, 3,
Este tipo de distribucin se emplea para describir procesos donde los
xitos buscados son expresados por unidad de rea, tiempo, unidad,
entre otros. Por ejemplo, el nmero de defectos en una tela por metro
cuadrado, el nmero de aviones que aterrizan en un aeropuerto por da,
hora o minuto, el nmero de bacteria pon centmetro cuadrado en un
cultivo, el nmero de llamadas que se reciben en un conmutador por
minuto, hora, da, el nmero de embarcaciones que llega a un puerto
por da, mes o ao.

Un experimento de Poisson sugiere del proceso de Poisson y tiene las


siguientes propiedades:

El nmero de resultados que ocurren en un intervalo de tiempo o


regin especficos es independiente de el nmero que ocurre en
cualquier otro intervalo disjunto de tiempo o regin del espacio disjunto.
Por ejemplo, si se toma una tabla de 1metro por un metro donde hay 5
defectos luego se subdivide la tabla en cuatro regiones de tal manera
que en la primera regin hay 2 defectos, en la segunda hay 2 defectos,
en la tercera hay 2 defectos y en la tercera no hay defectos, se nota que
el nmero de defectos que hay en una regin no afecta al nmero e
defectos que hay en otra regin. La figura 36 ilustra esta situacin. Note
que la probabilidad de que una subregin tenga defectos es
relativamente grande.

Figura 36. Los defectos que hay en una subregin no interfieren en los que
hay en otra subregin.

La probabilidad de que un resultado muy sencillo ocurra en un


intervalo de tiempo muy corto o en una regin pequea es proporcional
a la longitud del intervalo de tiempo o al tamao de la regin. Es decir,
al tomar el ejemplo anterior, si se subdivide la tabla en un mayor
nmero de cuadrados, de tal manera que cada subregin sea ahora ms
pequea ser menos probable encontrar defectos en cada una de ellas.
La figura 37 muestra que la probabilidad de encontrar un defecto en una
regin ha disminuido.

Figura 37. La probabilidad de encontrar un defecto en cada subregin


disminuy respecto a cuando se tenan slo cuatro subregiones.

La probabilidad de que ms de un resultado ocurra en un intervalo de


tiempo tan corto o en esa regin tan pequea es despreciable. Si se
sigue aumentando el nmero de subregiones se encontrar que habr
muchas ms de ellas que no tienen defectos que las que si tienen, es
decir la probabilidad de que hayas regiones con defectos es muy
pequea.

La distribucin de Poisson es la misma que la binomial pero aplicable


ms a valores grandes.
La distribucin de probabilidad o la funcin de probabilidad para una
distribucin de Poisson viene dada por:
x
(
np ) e np
P( X ) =
,

donde n es el nmero total de ensayos, p es la


x!
probabilidad de xitos, e es la constante de euler 2.71828 y x es el
nmero de xitos.
4.4.1. Media de una distribucin de probabilidad de Poisson. La
media viene dada por = np .
4.4.2. Desviacin estndar de una distribucin de probabilidad
de Poisson. La desviacin estndar est dada por = np .
4.4.3. Uso de tablas en la distribucin de Poisson. Al igual que en
la distribucin binomial, existen tablas que facilitan el clculo de la
probabilidad en las distribuciones de Poisson. Para usar las tablas de
distribucin de Poisson se hace necesario conocer:

La media de la distribucin , que a su vez se obtiene por el


conocimiento del nmero de veces que se realiza el experimento n y la
probabilidad de xito p .
El nmero de xitos: x .

Ejemplo 28. El nmero de accidentes que ocurren en un determinado


cruce de cuatro vas en Bucaramanga es de 6 accidentes por mes. Cul
es la probabilidad de que no haya, que haya 1, 2,3 accidentes en un
mes dado?
Aqu el xito se refiere a que no haya accidentes. La media es de = 6
accidentes por mes, por tanto:

6 0 e 6 e 6
=
= 0.0025 es la probabilidad de que no ocurra
0!
1
accidentes.
61 e 6 6e 6
P (1) =
=
= 0.015 es la probabilidad de que ocurra un accidente.
1!
1
6 2 e 6 36e 6
P ( 2) =
=
= 0.045 es la probabilidad de que ocurran dos
2!
2
accidentes.
P ( 0) =

63 e 6 216e 6
=
= 0.089 es la probabilidad de que ocurran tres
3!
6
accidentes.
P (3) =

Al usar la tabla de Poisson acumulada como se muestra en la tabla 26,


se puede obtener el mismo resultado. Esta tabla se encuentra en el
anexo.

Tabla 26. Distribucin acumulada de Poisson para xitos entre 0 y 16 y


medias entre 1.1 y 6.o.

Si se lee la probabilidad para x = 0, es decir para que ocurra accidente,


se obtiene el valor 0.002 que es aproximado al calculado. Para
encontrar las dems probabilidades hay que restar la probabilidad
inmediatamente anterior, de manera similar a como se hizo en la tabal
de la distribucin binomial acumulada. As:

P (1) = 0.017 0.002 = 0.015 ,


P (2) = 0.062 0.017 = 0.045 y
P (3) = 0.151 0.062 = 0.089 .

Si la pregunta fuera cul es la probabilidad de que ocurran dos o


menos
accidentes,
entonces
su
valor
sera:
P ( X 2) = P (0) + P (1) + P (2) = 0.0025 + 0.015 + 0.045 = 0.0625 , que es el valor
que puede leerse directamente de la tabla.
La distribucin para estas cuatro probabilidades se muestra en la tabla
27 y su grfica se muestra en la figura 38. La grfica de la distribucin
de Poisson acumulada se muestra en la figura 39.
Nmero de accidentes

Probabilidad

0
1
2
3

0.00225
0.0150
0.0450
0.0890

Tabla 25. Distribucin de probabilidad de Poisson para el ejemplo 28 para un


nmero de accidentes cero y tres.

Figura 38. Grfica de la distribucin de Poisson para el ejemplo 28.

Figura 39. Grfica de la distribucin de Poisson acumulada para el ejemplo 28.

La diferencia entre las grficas de las distribuciones binomial y de


Poisson es que la primera es simtrica mientras que la segunda es
sesgada a la derecha. Las grficas de las distribuciones acumuladas
tiene un comportamiento similar.
5.

DISTRIBUCIN DE PROBABILIDAD CONTINUA.

Una distribucin de probabilidad continua est sujeta a una variable


aleatoria continua. Las distribuciones de probabilidad continua ms
conocidas estn: la distribucin exponencial, la distribucin normal, la
distribucin gama, la distribucin Ji cuadrado, la distribucin t de
student, entre otras.
Una funcin f definida para un conjunto de valores se le conoce como
funcin de densidad de probabilidad para una variable continua X si
b

P ( a X b) =

f ( x)dx

para cualesquiera constantes a y b . Es decir que

para calcular la probabilidad de que el valor de la variable aleatoria


continua est entre x = a y x = b se debe encontrar el rea debajo de la
curva definida mediante la funcin de densidad de probabilidad entre
esos valores.
La probabilidad de que una variable aleatoria continua tome un valor
a

x = a es P(a ) =

f ( x)dx = 0 ,
a

es decir, cuando se trabaja con variables

aleatorias continuas no tiene sentido preguntar por la probabilidad en un


valor particular si no por la probabilidad en un intervalo de valores. Por
lo anterior, para el caso continuo tienen mayor importancia hablar la
distribucin de probabilidad acumulada y no de la distribucin de
probabilidades en si.

Para que una funcin f sea considerada una funcin de densidad de


probabilidad, se deben cumplir las dos condiciones siguientes:
f debe ser positiva o cero para cualquier valor de la variable
aleatoria continua, es decir, f ( x) 0 para todo x ( , ) . Esto significa
que la grfica de la funcin de densidad de probabilidad debe estar por
encima del eje horizontal (eje de las abcisas).
El rea debajo de la grfica de la funcin f entre menos infinito y el

infinito, debe ser igual a 1. Esto es

f ( x)dx = 1 .

5.1. Funcin de distribucin acumulativa. Para hablar de las


distribuciones de probabilidad acumulada para el caso continuo se hace
necesario definir la funcin de distribucin acumulativa o funcin de
distribucin.
La funcin de distribucin de una variable continua X viene dada por
a

F ( X ) = P( X a) =

f (t )dt ,

es decir la funcin de distribucin acumulativa

es el rea bajo la curva de la funcin de densidad de probabilidad


f entre menos infinito y el valor a .
5.2. Media, varianza y desviacin estndar de una distribucin de
probabilidades continua. En las distribuciones de probabilidad
continuas tambin se puede calcular la media, la varianza y la
desviacin estndar.
La Media. La media o el valor esperado se calcula por la frmula

x f ( x)dx .

La

2 =

Varianza.
2

(x )

f ( x)dx .

se

calcula

mediante

la

frmula

La desviacin estndar. Es la raz cuadrada de la varianza, se

(x )

simboliza por y viene dada por la frmula =

f ( x)dx .

Ejemplo 29. Para cierto tipo de bateras, la funcin de densidad de


probabilidad de que x horas sea la vida til de una batera elegida al
azar viene dada por:
1 40x

si x 0 .
f ( x) = 40 e
0
si x < 0
Demuestre que esta funcin es una buena funcin de densidad de
probabilidad.
Determine la probabilidad de que la vida til de una batera elegida al
azar
Est entre 30 y 50 horas.
Sea por lo menos 60 horas.
A lo ms 15 horas.
Grafique esta funcin de densidad de probabilidad.
Solucin.
Se nota que la funcin es positiva para todos los x 0 , pues est
definida en este intervalo mediante una funcin exponencial. Para x < 0
la funcin es cero. Luego esa funcin ser positiva o cero para todos los
valores de x . Luego se cumple la primera condicin.
x

1
40
e dx
f ( x)dx = f ( x)dx + f ( x)dx = 0 + f ( x)dx = 40

Lim 40x t
Lim 40t
1 40

e 1 = 1
=
e
dx
=

e
=

t 0 40
t
t

Luego se cumple la segunda condicin.

Lim

Por tanto la funcin definida es una buena funcin de densidad de


probabilidad.
La probabilidad de que la batera dure entre 30 y 50 horas es
x
3
50
x 50

5
1
P (30 x 50) = e 40 dx = e 40 = e 4 e 4 = 0.2865 + 0.4724 = 0.1859
30 40

30

La probabilidad de que la duracin de la batera sea de por lo menos


60 horas es

3
40x t
40t

e = Lim e e 2 = (0 0.223) = 0.223


Lim

t
t

60
La probabilidad de que la duracin de la batera sea a lo ms 15
horas es
x
15
x 15
15

1
P ( x 15) = e 40 dx = e 40 = e 40 e 0 = (0.687 1) = 0.313 .
0 40

La grfica de funcin de densidad de probabilidad se muestra en la


figura 40.

1
P (60 x) = e 40 dx =
60 40

Figura 40. Funcin de densidad de probabilidad continua para el ejemplo 29.

Note que esta es la grfica de la funcin de densidad de probabilidad y


no de la distribucin de probabilidades acumulativas. Cada rea que se
calcule debajo de la curva entre dos valores de la variable aleatoria de la
figura 39 representa la probabilidad acumulada en ese intervalo.
5.3. La distribucin normal. Debera llamarse distribucin
acumulativa normal, pues como se ha dicho, en las distribuciones
continuas tiene mayor sentido hablar de las distribuciones acumulativas.
Para mayor simplicidad se le llamar distribucin normal y a la funcin
de densidad de probabilidad se le llamar curva normal. La variable
aleatoria continua con distribucin normal es una de las distribuciones
ms importantes en el campo de la estadstica. Las caractersticas de la
distribucin normal son:
La curva normal es en forma de campana y presenta un pico en el
centro de la distribucin. La media, la mediana y la moda de la
distribucin son iguales y estn localizadas en el centro.
La distribucin normal es simtrica respecto a su media, por tanto el
rea debajo de la curva que est a la derecha de la media es igual a la
que est a la izquierda.

La curva normal decrece uniformemente en ambas direcciones a


partir del valor central. Es asinttica respecto al eje horizontal. Las
terminaciones de la curva a ambos lados de la media se les llama colas.

La grfica tpica de una distribucin normal se muestra en la figura 41.


En esta figura se muestra que la distancia entre el eje de simetra
(media) y el punto de inflexin de la curva normal es una desviacin
estndar. La funcin de densidad de probabilidad (curva normal) viene

f ( x) =

dada por

1
e
2

( x )2
2 2

Figura 41. Curva normal de una distribucin normal, con la media


desviacin estndar

y una

Dependiendo de los valores que tome la media y la desviacin


estndar la grfica ser ms alargada o achatada, pero en cualquier
caso tendr las mismas condiciones de simetra. Las figuras 42 y 43
muestran estas posibilidades.

Figura 42. distribuciones normales con igual media


estndar

diferentes.

pero con desviaciones

Figura 43. distribuciones normales


desviaciones estndar iguales.

con

medias

diferentes

pero

con

El rea total debajo de la curva es igual a 1. El rea debajo de la curva


comprendida entre y + es aproximadamente igual a 0,68 del
rea total; entre 2 y + 2 es aproximadamente igual a 0,95 del
rea total. Las figuras 44 y 45 ilustran las reas descritas.

Figura 44. Porcentaje del rea comprendida entre

Figura 45. Porcentaje del rea comprendida entre

+ .

+ 2

Los nicos parmetros necesarios para dibujar el grfico de la


distribucin normal son y . Con estos dos parmetros se puede

situar la campana (en el punto correspondiente a la media) y cual es su


ancho (determinado por la desviacin estndar).
Cuando se encuentra con una poblacin de observaciones que siga una
distribucin normal, slo hace falta estimar la media y la desviacin
estndar para tener toda la informacin necesaria acerca de dicha
poblacin.
5.3.1. Distribucin normal estndar. Para calcular la probabilidad de
que la variable aleatoria normal se encuentre en un intervalo hay que
encontrar el rea debajo de la curva normal en dicho intervalo. El
problema radica en que calcular esta rea por medio de integrales es
muy complicado pues la antiderivada de la funcin de densidad no se
puede expresar en trminos de funciones elementales. Para resolver el
problema se define la distribucin normal estndar que es la ms
sencilla, usada y conocida y es aquella que tiene por media = 0 y por
desviacin estndar = 1 . Esta distribucin normal estndar se suele
representar por Z y los valores de las reas entre menos infinito y los
distintos valores de Z se encuentran tabulados (ver anexo). La grfica
de esta curva se denomina campana de Gauss y se puede observar en la
figura 46.

Figura 46. Distribucin normal estndar.

La funcin de densidad de probabilidad para la distribucin normal


x2

estndar queda entonces f ( x) =

1 2
e .
2

5.3.2. Clculo de probabilidades.


Para un valor a cualquiera, la probabilidad de que la distribucin Z, sea
menor o igual a a , es decir, P ( Z a ) es el rea encerrada bajo la curva
normal desde menos infinito ( ) hasta a . En la figura 47 se muestra
esta rea sombreada.

Figura 47. El rea encerrada entre y


la distribucin Z sea menor o igual a a .

a representa la probabilidad de que

5.3.3. Uso de la tabla de la distribucin normal estndar. Los


valores de las reas debajo de la curva normal estndar se encuentra
tabulados para valores de Z entre cero y cuatro. Por ejemplo si se
quiere calcular la probabilidad de que Z sea menor que 1.24 ( P ( Z 1.24) )
hay que realizar los siguientes pasos:
Buscar la parte entera y las dcimas en la columna de la izquierda.
Para el ejemplo se busca 1.2.
Se busca la centsima en la fila superior. Para el ejemplo la
centsima es 4.
Se traza una recta desde la fila hacia abajo y una desde la columna
hacia la derecha. En la interseccin se encuentra el valor del rea
debajo de la curva entre menos infinito y Z, que para el ejemplo es
0.892512, es decir, P ( Z 1.24) = 0.892512 . La tabla 26 muestra una
porcin de la tabla de la distribucin normal estndar y el procedimiento
que se sigue.

Tabla 26. Porcin de la tabla de la distribucin normal estndar y explicacin


del procedimiento para hallar el valor del rea para un Z determinado.

Si se quiere calcular probabilidades para valores mayores que 4 hay que


notar que para este valor la probabilidad es 0.999968 (prcticamente
1), por tanto para valores mayores que cuatro se dir que la
probabilidades aproximadamente 1.
Clculo de otras probabilidades.
Si se quiere encontrar la probabilidad de que Z sea mayor o igual a a
donde a es positivo, la tabla no servira, pues esta contiene slo reas
para valores menores o iguales que a . El problema se soluciona
aplicando el principio del complemento para las probabilidades
(apartado 5.3. de la unidad IV). El complemento de Z a es Z < a pero
como Z = a no influye en la probabilidad, se puede decir que el
complemento de Z a es Z a , por tanto P ( Z a ) = 1 P ( Z a ) . Luego
para calcular la probabilidad de que Z sea mayor o igual a a , se resta 1
a la probabilidad de que Z sea menor o igual a a , que se obtiene
mediante el procedimiento descrito. La figura 48 muestra la regin
sombreada correspondiente a la probabilidad de que Z sea mayor que
a.

a.
Si se quiere calcular la probabilidad de que Z sea menor o igual que
a siendo a positivo, la tabla tampoco servira pues en ella se
encuentran slo valores positivos para Z. La solucin a este
inconveniente se basa en que la curva normal estndar es simtrica, es
decir que calcular el rea debajo de la curva entre menos infinito y a
es la misma rea debajo de la curva entre a y el infinito. Por tanto
P ( Z a ) = P ( Z a ) y de acuerdo con lo visto en el caso anterior se
obtiene P ( Z a ) = 1 P ( Z a ) . En la figura 49 se puede observar la
igualdad de las reas para Z mayores o iguales a a y para Z menores o
iguales a a
Figura 48. rea que representa la probabilidad de que Z sea mayor que

Figura 49. rea iguales tanto para Z menor o igual a


o igual que a .

a como para Z mayor

Si a es positivo y se quiere calcular la probabilidad de que Z sea


mayor o igual que a , se puede proseguir as: P ( Z a ) = 1 P ( Z a )
por el primer caso. Ahora como en el segundo caso se dedujo que
P ( Z a ) = 1 P ( Z a ) , entonces P( Z a) = 1 (1 P( Z a) ) = P( Z a) , es
decir, el rea debajo de la curva normal estndar entre a y el infinito
es igual al rea debajo de la curva normal estndar entre menos infinito
y a , o sea que de nuevo la simetra es vlida. La figura 50 muestra la
igualdad de estas reas.

Figura 50. reas iguales tanto para Z mayor o igual a


o igual a a .

a como para Z menor

Si se requiere calcular la probabilidad de que el valor Z est entre


dos valores a y b , es decir, P (a Z b) ; se resta el rea
correspondiente a la probabilidad P ( Z a ) del rea correspondiente a la
probabilidad P ( Z b) , es decir P (a Z b) = P ( Z b) P ( Z a ) La figura 51
ilustra esta situacin.

Figura 51. La probabilidad de que Z est entre a y b es la diferencia entre las


reas debajo de la curva normal estndar entre menos infinito y b y menos
infinito y a .

Si la distribucin es normal no estndar entonces de acuerdo a la


X
Z=
relacin
se puede estudiar mediante una distribucin

estndar. Este procedimiento se llama tipificacin de la variable X. Al


valor Z se le llama valor normal estndar.
Ejemplo 30. Las estaturas de los 800 estudiantes de un plantel
educativo de bachillerato siguen una distribucin normal donde la media
es de 150 centmetros con una desviacin estndar de 10 centmetros.
Cuntos estudiantes miden entre 145 y 155 centmetros?
Solucin.
Sea X la distribucin de estudiantes tal que X siga una distribucin
normal con = 150 y = 10 . Se pide calcular P (145 X 155) . Para
utilizar las tablas de distribucin normal estndar es necesario tipificar,
el procedimiento es el siguiente:
145 X 155
P (145 X 155) = P (145 X 155 ) = P



155 150
145 150
= P
Z
= P (0.5 Z 0.5)
10
10

Es decir, la probabilidad para que la X est entre 145 y 155 es


exactamente igual a la probabilidad de que el valor normal estndar
est entre 0.5 y 0.5. Segn los casos vistos y segn la tabla, se tiene
que P (0.5 Z 0.5) = P ( Z 0.5) P ( Z 0.5) = P ( Z 0.5) P ( Z 0.5)
= P( Z 0.5) (1 P( Z 0.5) = 2 P ( Z 0.5) 1 = 2 * 0.691462 1 = 0.383924 .
Esto significa que aproximadamente el 38.39% de los estudiantes mide
entre 145 y 155 centmetros.
Si se preguntara ahora por la probabilidad de que un estudiante al azar
mida ms de 155 centmetros.
Para

ms

de 155 centmetros hay que calcular P ( X 155) y


155 150
X 155

P ( X 155) = P

= P Z
= P ( Z 0.5) = 1 P ( Z 0.5) y

10

por
tablas
se
tiene
que
P ( Z 0.5) = 0.691462 ,
por
tanto
P ( X 155) = 1 0.691462 = 0.308538 .
Hasta este punto se ha pedido calcular la probabilidad de que para un
cierto valor a , Z a ; esto es P ( Z a ) . Ahora si se conoce la probabilidad
de que Z a , por ejemplo, P ( Z a ) = c para algn valor c , cul es el

valor de a ?. La solucin es fcil y se explicar mediante un ejemplo. Si


se requiere hallar el valor de a tal que P ( Z a ) = 0.922196 , slo se busca
dentro de la tabla de la distribucin normal este valor y se encuentra en
la interseccin de la fila 1.4 con la columna 0.02 por tanto a = 1.42 .
Es posible que el valor no aparezca directamente en la tabla entonces se
puede aproximar de dos formas:
Si la probabilidad est entre dos valores que aparecen en la tabla
pero que no est cercana a ninguno de los dos. Por ejemplo, cul es el
valor de a tal que P ( Z a ) = 0.825 ? Esta probabilidad est entre
0.823814 que corresponde al valor 0.93 y 0.826391 que corresponde al
valor 0.94, luego la probabilidad de 0.825 est en la media de 0.93 y
0.93 + 0.94
0.94, o sea a =
= 0.935 .
2
Si la probabilidad est entre dos valores; pero est ms cercano a
uno de ellos, entonces se toma el valor de el. Por ejemplo, cul es el
valor de a tal que P ( Z a ) = 0.8530 ? Esta probabilidad est entre
0.850830 que corresponde al valor de 1.04 y 0.853141 que corresponde
al valor de 1.05. Como el valor 0.8530 est ms cercano a 0.853141,
entonces el valor de a es 1.05.
Si la distribucin no es normal y se pregunta por el valor de a tal que
P ( X a ) = c , para algn valor de c . Se tipifica la distribucin y se sigue
el procedimiento descrito. Por ejemplo sea una distribucin normal con
media = 10 y desviacin estndar = 5 , P ( X a ) = 0.980774 , entonces
a
X a

P ( X a ) = P

= P Z
= 0.980774 y por tablas se obtiene


a
el valor de
= 2.07 y al despejar a = 2.07 * + , por tanto a = 20.35

6. EJERCICIOS DE LA UNIDAD.

6.1. El ingreso medio de un habitante en Colombia es de 4


millones de pesos al ao, con una varianza de 0.8. Se supone que
se distribuye segn una distribucin normal. Calcule:
Porcentaje de la poblacin con un ingreso inferior a 3 millones
de pesos.
Ingreso a partir del cual se sita el 10% de la poblacin con
mayores ingresos.
Ingresos mnimo y mximo que engloba al 60% de la poblacin
con renta media.

6.2. La vida media de los habitantes de un pas es de 65 aos, con


una varianza de 30. Se hace un estudio en una pequea ciudad de
100.000 habitantes:
Cuntas personas superarn previsiblemente los 75 aos?
Cuntos vivirn menos de 60 aos?

6.3. El consumo medio anual de cerveza de los habitantes de


Barranquilla de 100 litros, con una varianza de 20. Se supone que
se distribuye segn una distribucin normal.
Si usted presume de buen bebedor, cuntos litros de cerveza

tendra que beber al ao para pertenecer al 5% de la poblacin


que ms bebe?.
Si usted bebe 45 litros de cerveza al ao y su mujer le
califica de borracho qu podra argumentar en su defensa?
6.4. Se han presentado 2.000 aspirantes a una entrevista de
ECOPETROL. Dichas entrevistas se calificaron de 0.0 a 10.00 La
nota media ha sido un 5,5, con una varianza de 4.
Tan slo hay 100 plazas. Usted ha obtenido un 7,7. Sera
oportuno ir organizando una fiesta para celebrar su xito?
Va a haber una 2 oportunidad para el 20% de notas ms altas
que no se hayan clasificados. A partir de que nota se podr
participar en esta nueva oportunidad?

6.5. Cierto tipo de batera dura un promedio de 2 aos, con una


desviacin estndar de 0,3 aos. Suponiendo que la duracin de las
bateras
es
una
variable
normal:
a) Qu porcentaje de bateras se espera que duren entre 2 y 4 aos?
b) Si una batera lleva funcionando 1.8 aos. cul es la probabilidad
de que dure menos de 2.2 aos?
6.6. El 90% de los miembros de un club pasan sus vacaciones en la
playa. Calcule una aproximacin, obtenida utilizando tablas de la
normal, de la probabilidad de que, de un grupo de 60 miembros del
club, 50 o menos vayan a ir a la playa a pasar sus vacaciones.
6.8.Suponga que la probabilidad de que una pareja tenga un hijo o una
hija es igual. Calcular la probabilidad de que una familia con 6
descendientes tenga 2 hijos.

6.9. Los alumnos de cierta clase se encuentran en una proporcin del


67% que estudian ingls y el resto francs.
Si se toma una muestra de 15 alumnos de la clase, calcule:

La probabilidad de que al menos se encuentren tres alumnos de


ingls.

La probabilidad de que los 15 alumnos estudien ingls.

La probabilidad de que estudien ingls entre 7 y 10 alumnos.


Considere xito = estudiar ingls y fracaso = estudiar francs
6.10. Calcule las siguientes probabilidades:
P ( Z 0.96) y P ( Z 1.01)

P (0.96 Z 1.49) y P (1.32 Z 0.57)


P ( Z 0.3) y P ( Z 2.7)
6.11.Calcule el valor de a tal que:
P ( Z a ) = 0.8078
P ( Z a ) = 0.028
6.12. Calcular a si P ( X a ) = 0.6141 y X sigue una distribucin normal
con desviacin estndar de = 4 y media de = 15 .
6.13. De una variable normal se sabe que P ( X 7) = 0.9772 y
P ( X 6.5) = 0.8413 Calcule:
y .
P (5.65 X 6.25) .
El nmero a tal que P ( X > a ) = 0.3 .
6.14. En un proceso de fabricacin de tornillo se sabe que el 2% son
defectuosos. Se empaquetan en cajas de 50 tornillos. Calcule la
probabilidad de que en una caja:
No haya un tornillo defectuoso.
Haya exactamente un tornillo defectuoso.
Ms de dos tornillos defectuosos.
6.15. En un examen de 100 preguntas hay 4 opciones de respuesta de
las que hay que seleccionar una. Si se responde al azar cul es el
nmero esperado de respuestas correctas? cul es la desviacin
estndar?.
cada vez , a la ur na. >C u_al es l a probabilidad de q ue 5 sean bl ancas?.
Si repeti mos 10 vec es l a experienci a, >C u_anto vale la media y la des vi aci_on t__pic a?.

BIBLIOGRAFA
MEYER, Paul. PROBABILIDAD Y APLICACIONES ESTADSTICAS. 2a ed.
Washington: Addison Wesley Iberoamericana, 1986.
VELASCO S, Gabriel., y WISNIEWSKI M, Piotr. PROBABILIDAD Y
ESTADSTICA PARA INGENIERA Y CIENCIAS, 1a ed. Mxico: Thomson,
2001.
MENDENHALL, William., VACKERLY D, Dennis., y SCHEAFFER, Richard.
ESTADSTICA MATEMTICA CON APLICACIONES. 2a ed. New York:
Iberoamericana, 1994.
CARRANZA, Roque., MTODOS MATEMTICOS DE ESTADSTICA. 2a ed.
Madrid: Aguilar, 1968.
FREEMAN, Harold., INTRODUCCIN A LA INFERENCIA ESTADSTICA. 3a
ed. Mxico: Trillas, 1970.
RIOS, Sixto., MTODOS ESTADSTICOS. 5a ed. New York: Mc Graw Hill,
1967.
GARCA, lvaro. ESTADSTICA. 2a ed. Bucaramanga: UIS, 1985.
LIND, Douglas., MARCHAL, William., MASON, Robert. ESTADSTICA
PARA ADMINISTRACIN Y ECONOMA. 11a ed. Mxico: Alfaomega,
2005.

TABLAS

También podría gustarte