Está en la página 1de 123

1

ESTADISTICA I

INTRODUCCION

 CONCEPTOS BASICOS

Cuando se habla de Estadística, se suele pensar en conjuntos de datos numéricos


presentados de forma ordenada y sistemática. Esta idea hace referencia a la acepción
popular que existe sobre el término y que cada vez está más extendida.
La Estadística es la ciencia que estudia cómo debe emplearse la información y pretende
dar una guía de acción en situaciones prácticas que entrañan incertidumbre.
Con el fin de ver de una manera más específica la forma con que trabaja esta ciencia,
introduciremos los siguientes conceptos:

POBLACIÓN
Es un conjunto de elementos de naturaleza cualquiera de los cuales estamos interesados
en estudiar al menos una característica común y observable de dichos elementos en un
determinado lugar y en un momento dado.
Observación: La población en estudios debe estar definida sin ambigüedad de manera
que no de lugar a confusiones. Los elementos consideramos que se encuentran
localizados en un determinado lugar o región geográfica y en un periodo de tiempo dado.

EJEMPLO
El conjunto de todos los estudiantes matriculados en la UNI-IES en el presente año.
Elementos: estudiantes.
Características: sexo, Nº asignaturas que lleva, estatura, edad, año que lleva, turno,
procedencia, etc.

VARIABLES
Utilizaremos variables como X, Y, Z, etc. para representar las características de los
elementos
Existen básicamente 2 tipos de variables:
Variables cualitativas: Son las que producen respuestas categóricas. (Atributos o
modalidades)
Variables cuantitativas: Son las que producen respuestas numéricas. (Valores)

Si X representa la edad entonces X es cuantitativa.


Si Y representa el sexo entonces Y es cualitativa.

Las variables cuantitativas pueden considerarse como variables discretas y variables


continuas.
2

Variables discretas: Son aquellas cuyos valores posibles tienen interrupción ( esto es,
se separan sin haber valores intermedios ) Por lo general provienen de un proceso de
conteo.

Si Z representa el número de asignaturas que lleva entonces Z es discreta.


Variables continuas: Son aquellas cuyos valores posibles no tienen interrupción. Por lo
general provienen de un proceso de medición.

Si X representa la estatura entonces X es contínua.

DATOS ESTADISTICOS
Loa valores posibles de una característica X los denotaremos por x , mientras que los
valores realmente observados de esa característica X , los llamaremos datos y los
denotaremos por xi donde el valor del subíndice i nos indica que es la i-ésima observación
de X.

Con frecuencia usaremos el término población para referirnos a la totalidad de datos que
podrían recopilarse en una situación dada.
x1 , x2 , … , xN
PARAMETROS
Es una medida que proviene de todos los datos de la población. Los parámetros son
constantes que representan por lo general características de la población. Generalmente se
representan por letras griegas.
Por ejemplo, la media poblacional es un parámetro que se denota y define como
N

x1  x 2  ...  x N 
xi
μ  .
N N

Si X representa la edad entonces  representa la edad promedio

MUESTRA
Es una parte de la población que se espera sea representativa de ella.
Con frecuencia usaremos el término muestra para referirnos a los datos muestrales x 1 , x2 ,
… , xn

Población tamaño N

X
x1 muestra tamaño n
x2
. x1, x2,….xn
.
xN datos muestrales
ESTIMACION DE UN PARAMETRO
3

Es una medida que proviene de los datos muestrales. Las estimaciones varían de una
muestra a otra y representan características de las muestras.
Por ejemplo, la media muestral de un conjunto de datos x1 , x2 , … , xn se denota y define
como
n

x  x  ...  x n x i
x 1 2  .

n n

Si X representa la edad entonces x representa la edad promedio y se considera una


estimación o estimado de µ.

MUESTREO Y CENSO
Como el fin de la Estadística es llegar a conocer un parámetro esto podemos lograrlo
haciendo:
Un muestreo: un examen sobre una parte de la población.
Un Censo: un examen sobre toda la población.

 ¿QUE ES LA ESTADISTICA?

La Estadística estudia los métodos y procedimientos para recopilar, organizar, presentar y


analizar datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínsica
de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar
a la toma de decisiones y en su caso formular predicciones.

 DIVISION DE LA ESTADISTICA

ESTADÍSTICA DESCRIPTIVA
Es la parte de la estadística que estudia los métodos de recopilación, organización,
presentación y caracterización o análisis de un conjunto de datos.

ESTADÍSTICA INFERENCIAL
Estudia los métodos que hacen posible la estimación de un parámetro en base a datos
muestrales.
4

 APLICACIONES DE LA ESTADISTICA A LA ECONOMIA, LA ADMINISTRACION


DE EMPRESA Y LA CONTABILIDAD.

Mostraremos como las técnicas estadísticas pueden servir al economista, al administrador


de empresa y al contador para obtener un conocimiento amplio sobre su realidad
económica y social.
Es obvio que toda persona que se dedique al mundo de los negocios, industria, empresa,
comercio, etc., necesita información sobre las características del ambiente en que realiza
su actividad.
Cualquier información cualitativa o cuantitativa debidamente tratada, puede servir para el
conocimiento, desarrollo y control de los principales subsistemas funcionales de la
empresa. Si analizamos algunos de estos subsistemas es posible encontrar ejemplos en
los que la Estadística puede constituir un auténtico elemento de ayuda.

Recursos humanos
Para la selección del personal los empresarios suelen usar cada vez con más frecuencia
resultados obtenidos en test de aptitudes y conocimientos deseables en la persona a
contratar. Las técnicas descriptivas son instrumentos adecuados para el tratamiento de las
puntuaciones numéricas alcanzadas en dichos test.

Auditoria
Uno de los nuevos instrumentos de que disponen los auditores de hoy, es el empleo de
métodos de muestreo, a fin de reducir la cantidad de revisión detallada que se necesita.
Suponga que una empresa tiene una cantidad muy grande de cuentas por cobrar. Un
auditor puede utilizar algún método de muestreo estadístico para seleccionar una muestra
de cuentas y a partir de ella estimar el saldo total de las cuentas. Si la cantidad que
aparece en los libros de la empresa no cae dentro de los límites de la estimación, el auditor
puede considerar la posibilidad de hacer un asiento de ajuste al valor en libros.

Marketing
Los estudios de mercado dirigidos al conocimiento de la demanda de productos, productos
competidores, efectos de campañas publicitarias, etc., se llevan a cabo con
regularidad en la empresa. Antes de sacar un producto al mercado se suele realizar
una investigación al respecto mediante muestreo con objeto de obtener alguna
información. Las técnicas estadísticas permiten en estas situaciones inferir valores de
parámetros a partir de la información muestral. Por supuesto, a partir de una
muestra no se puede conocer con exactitud y precisión las características de toda la
población, siempre habrá un grado de incertidumbre sobre el verdadero valor del
parámetro, el cual puede ser cuantificado en términos de probabilidad.
5

Producción
En el proceso de fabricación de un producto intervienen innumerables factores (materias
primas, maquinarias, obreros, etc.) que afectan a las características de calidad de ese
producto. En muchas fábricas es corriente ver cómo los productos llegan a una banda
transportadora en cuyo final hay una máquina empacadora que los envía al almacén.
Entre la banda transportadora y la máquina de empacar suele haber un operario que
observa atentamente los productos que llegan y ocasionalmente arroja alguno a un
cesto cercano. Está eliminando productos defectuosos.
Hoy día el control de calidad de la producción es básico para que los artículos producidos
cumplan los requisitos de calidad establecidos por las normas tanto nacionales como
internacionales. Los métodos estadísticos son una herramienta eficaz en esta área para
mejorar los procesos de producción y reducir sus defectos.

Finanzas
Resulta evidente que cualquier profesional de la empresa o los negocios debe adquirir una
formación básica en estadística en un proceso de aprendizaje, que le permita moverse con
soltura en el mundo que le rodea. Si ha de tomar decisiones en un entorno de
fluctuaciones y riesgos, no bastará con entender la terminología estadística, necesitará
conocerla lo suficiente como para aplicarla y hacer de ella una herramienta eficaz en el
ejercicio de su actividad.
Las decisiones de una empresa de invertir en nuevos productos, locales, maquinarias,
etc.,vendrán condicionadas por los beneficios esperados del dinero. Para ello son de gran
utilidad las técnicas de predicción, que constituyen una auténtica necesidad en el mundo
de los negocios.
6

TEMA 1 : ESTADISTICA DESCRIPTIVA

OBJETIVOS.

1. Conocer procedimientos para organizar datos en una distribución de frecuencias.


2. Construir e interpretar tablas y gráficas estadísticas.
3. Calcular e interpretar medidas de posición, dispersión, asimétria y apuntamiento de datos.

1.1 INTRODUCCION
Este tema pretende introducir al estudiante en el manejo de datos numéricos, enseñarle a organizar y
presentar datos obtenidos de un estudio mediante la construcción de tablas y gráficas estadísticas.
También será de vital importancia poder condensar la información en medidas que la representen en
forma clara, por tal razón, trataremos de encontrar valores para esas medidas (estadísticos o
parámetros ) que logren sintetizar la información. Estas medidas expresarán la posición, dispersión,
asimetría y forma de los datos.

1.2 RECOPILACIÓN DE DATOS


Consiste en la utilización adecuada de técnicas que permitan recoger la información de la manera
más eficiente.
Los datos pueden ser recopilados de:
a) Registros internos
b) Publicaciones
c) Encuestas
Cuando a) y b) no son apropiados para el estudio que estamos haciendo utilizamos la encuesta, esto
es, un instrumento que nos permite recopilar la información necesaria.
La encuesta está limitada por factores: tiempo, dinero, recursos materiales y humanos disponibles.
Se puede llevar a cabo por dos formas:
a) Por muestreo
b) Por censo.

1.3 ORGANIZACIÓN (RESUMEN) DE LOS DATOS


Aquí la información se resume con el fin de facilitar su presentación y análisis posterior.

1.3.1 DATOS AGRUPADOS EN CLASES


Introduciremos primero algunos conceptos:

 Un intervalo de clase o simplemente clase se denota y define como:

Li ---- Ls : Más de Li hasta Ls

donde Li el límite inferior y Ls es el límite superior de la clase.

 Una clase de extremo abierto es la que no especifica uno de sus límites


y la denotaremos así:

Hasta Ls
Más de Li
7

 Amplitud o tamaño de un intervalo de clase

c = Ls – Li

 Punto medio de un intervalo de clase o marca de clase j

Li  Ls
mj  j = 1, 2, ....., g
2

EJEMPLO 1.1
Los siguientes datos corresponden a consumos mensuales registrados (en cienes de córdobas) en 30
familias del barrio Costa Rica.

Tabla 1.1 Datos originales de los consumos mensuales

24 16 26 31 17 25 17 23 23 19
21 17 13 20 30 24 19 22 21 18
25 14 29 20 26 15 27 21 22 23

Fuente: Encuesta realizada por INEC

Organice los datos recopilados anteriormente en 5 clases

1. Ordenar los datos

13 14 15 16 17 17 17 18 19 19
20 20 21 21 21 22 22 23 23 23
24 24 25 25 26 26 27 29 30 31

2. Determinar el rango

R = xmayor – xmenor = Dato mayor - Dato menor R = 31 - 13 = 18

3. Determinar N clases '' g '' y tamaño de clase ''c''.


R
Si g es dado , c  pero cercano a
g
18
c> = 3.6 tomaré C = 4
5

4. Escribir las clases.

El límite inferior de la primera clase debe ser un número menor y cercano al dato menor.
El límite superior de la última clase debe ser mayor o igual, pero cercano, al dato mayor.

Tabla 1.2 Organización de los datos de la tabla 1.1 del ejemplo 1.1
8

N familias Ls última clase = Li primera clase + gc

12 ------- 16 4 Ls última clase = 12 + 5 ( 4 ) = 32


16 ------- 20 8
20 ------- 24 10
24 ------- 28 5
28 ------- 32 3

30

5. Contar los datos

1.4 PRESENTACION DE DATOS


Una vez organizados los datos debemos presentarlos de una forma fácil de entender, esto es que
podamos percibir fácilmente los hechos esenciales de la información.
Los datos serán presentados en una tabla que contendrá básicamente : un título, un cuerpo y una
fuente.
También presentaremos los datos por gráficas, en las cuales tomaremos en el eje horizontal la
característica de interés x y en el eje vertical las frecuencias.
Debemos tener cuidado en la selección de las unidades en los ejes:
Regla de los 3/4
La altura del punto correspondiente a la mayor frecuencia debe ser aproximadamente igual a los 3/4
del eje horizontal.

1.4.1 DATOS CUANTITATIVOS


Cuando la característica de interés de los elementos sea una variable cuantitativa, se obtendrán de
ella lo que llamaremos datos cuantitativos, que pueden ser presentados en tablas o gráficas.

1.4.1.1 DATOS REPETIDOS


Cuando los datos están muy repetidos es útil contar el número de veces que se repite cada dato.
Supongamos que fi representa la frecuencia conque se presenta el dato x i de una variable de interés
X.
Podemos presentar este conjunto de datos en lo que llamaremos una distribución de frecuencias de
X, mediante una tabla o una gráfica.

TABLA DE FRECUENCIAS DE UNA VARIABLE DISCRETA

EJEMPLO 1.2
Supongamos que los siguientes datos representan número de días de atraso en el pago de 10 cuentas
de crédito.
1, 2, 1, 0, 2, 1, 2, 3, 0, 2
9

Si X representa el número de días de atraso en el pago de las cuentas, podemos presentar esta
información en la siguiente tabla:

Tabla 1.3 Título: Distribución de frecuencias del número de días de atraso en el pago de 10 cuentas
de crédito.
xi fi
N° días N° cuentas

0 2
1 3
2 4
3 1

10

Fuente: BANPRO

GRAFICO DE FRECUENCIAS DE UNA VARIABLE DISCRETA

EJEMPLO 1.3
Con los datos de la tabla 1.3 del ejemplo 1.2 obtenemos la siguiente figura.

f 5
4
3
2
1
0
-1 0 1 2 3 4
X

Figura 1.1 Distribución de frecuencias del número de dias de atraso en el pago de 10 cuentas de
crédito.

1.4.1.2 DATOS AGRUPADOS EN CLASES


Para presentar datos agrupados en clases necesitaremos introducir los siguientes conceptos:

fj : frecuencia ( absoluta ) de la clase j. Número de datos en la clase j

faj : frecuencia acumulada hasta la clase j. Número de datos cuyos valores son inferiors o iguales al
límite superior de la clase j .

faj = f1 + f2 + … + fj
10

frj : frecuencia relativa de la clase j. Proporción de datos que corresponde a la clase j .

fj
frj  j=1,2,…,g
n

fraj : frecuencia relativa acumulada hasta la clase j. Proporción de datos cuyos valores son
inferiores o iguales al límite superior de la clase j
.
fa j
fra j  j=1,2,…,g
n

Cuando los datos están agrupados en clases diremos que forman una distribución de frecuencias , la
cual, puede ser presentada por una tabla estadística o una gráfica estadística.

TABLA DE FRECUENCIAS ( ABSOLUTAS, RELATIVAS, ACUMULADAS, RELATIVAS


ACUMULADAS )

EJEMPLO 1.4
Con los datos de la tabla 1.2 del ejemplo 1.1 obtenemos la siguiente tabla.

Tabla 1.4 TITULO : Distribuciones de frecuencias de los consumo mensuales de 30 familias del
barrio Costa Rica.

fj frj faj fraj


Niveles de N familias Prop. Familias N familias Prop. familias
Consumo hasta clase j hasta clase j
mj

10
12 --- 16 14 4 0.13 4 0.13
16 --- 20 18 8 0.27 12 0.40
20 --- 24 22 10 0.33 22 0.73
24 --- 28 26 5 0.17 27 0.90
28 --- 32 30 3 0.10 30 1.00
34

30 1.00

Conteste las siguientes preguntas :


1. ¿ Cuántas familias tienen un consumo entre 16 y 24 ?
2. ¿ Qué proporción de familias tienen un consumo entre 20 y 24 ?
3. ¿ Cuántas familias tienen un consumo inferior a o igual 28 ?
4. ¿ Qué proporción de familias tienen un consumo inferior o igual a 24
11

HISTOGRAMA DE FRECUENCIAS / HISTOGRAMA DE FRECUENCIAS RELATIVAS

Ubicamos en el eje horizontal los límites inferiores y superiores de cada clase.


Dibujamos rectángulos tales que las longitudes de las bases correspondan a los tamaños de las clases
y las alturas sean las correspondientes frecuencias de las clases.

EJEMPLO 1.5
Con datos de la tabla 1.4 del ejemplo 1.4 obtenemos la siguiente figura.

f 12

10
10
8
8

6 5
4
4 3

0
12 16 20 24 28 32
X

Figura 1.2 Histrograma de frecuencias de los consumos mensuales de 30 familias del barrio Costa
Rica.

POLÍGONO DE FRECUENCIAS
Se forman haciendo que cada marca de clase represente los datos de esa clase. Luego se toman las
frecuencias correspondientes a cada marca de clase para después unir los puntos resultantes con
segmentos. Algunos prolongan el polígono hasta las marcas de clase imaginarias inferior y superior
inmediata

EJEMPLO 1.6
Con datos de la tabla 1.4 del ejemplo 1.4 se ha dibujado el polígono de frecuencias de los consumos
mensuales de las 30 familias. Ver figura 1.3
12

f
12
10
8
6
4
2
0
10 14 18 22 26 30 34
X

Figura 1.3

POLÍGONO DE FRECUENCIAS ACUMULADAS (OJIVA) / POLÍGONO DE


FRECUENCIAS RELATIVAS ACUMULADAS (OJIVA PORCENTUAL)
Ubicamos en el eje horizontal los límites superiores de todas las clases. Algunos prolongan el
polígono hasta el límite superior imaginario de la clase imaginaria inferior inmediata

EJEMPLO 1.7
Con datos de la tabla 1.4 del ejemplo 1.4 obtenemos la siguiente figura.

fa
35
30
25
20
15
10
5
0
12 16 20 24 28 32
X

Figura 1.4 Polígono de frecuencias acumuladas ( Ojiva ) de los consumos mensuales de 30 familias
del barrio Costa Rica.
13

1.4.1.3 DATOS RELACIONADOS CON EL TIEMPO

EJEMPLO 1.8

Tabla 1.5 Costo de la canasta básica en córdobas a nivel nacional durante el período 1991 – 2000.

Años 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Costo 750 780 820 880 1100 1200 1350 1550 1600 1700

Fuente. Banco Central de Nicaragua.

GRAFICO DE LINEAS
Consiste en un conjunto de líneas o segmentos de recta que muestran los cambios que experimenta
una determinada variable, generalmente en función del tiempo. Las coordenadas se pueden graficar
en el centro del período de tiempo.

EJEMPLO 1.9
Con los datos de la tabla 1.5 del ejemplo 1.8 obtenemos la siguiente figura.

1800
1700
1600
1500
1400
Costo

1300
1200
1100
1000
900
800
700
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Añ os

Figura 1.5 Gráfico de líneas del costo de la canasta básica en córdobas a nivel nacional durante el
período 1991 – 2000.

Observe que el costo de la canasta básica siempre crece durante el período 1991 – 2000, ocurriendo
un crecimiento a un ritmo mayor a partir de 1995.
14

EJEMPLO 1.10
Tabla 1.6 Salario mínimo del sector industrial a nivel nacional para el período 1991 – 2000.

Años 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Salarios 400 500 600 700 800 850 900 950 1000 1050

Fuente: Banco Central de Nicaragua.

COMPARACION DE GRAFICOS LINEALES


Estos gráficos generalmente se utilizan para comparar aspectos contrapuestos tales como ingresos –
gastos, exportación – importación, etc.

EJEMPLO 1.11
Con los datos de la tabla 1.6 y 1.5 de los ejemplos 1.8 y 1.10 respectivamente obtenemos la
siguiente figura.

BRECHA ENT RE CANAST A BASICA Y SALARIO


1800
1700
1600
1500
1400
1300
Costo / Salario

1200
1100
1000
900
800
700
600
500
400
300
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Años

Costo Salario

Figura 1.6 Comparación del costo de la canasta básica y el salario mínimo del sector industrial para
el período 1991 – 2000.
Observe que el costo de la canasta básica siempre es mayor que el salario mínimo, ocurriendo la
diferencia más pequeña de C$ 180 en el año 1994.
De 1991 a 1994 el salario creció a un ritmo mayor que el costo de la canasta básica, pero de 1995 a
2000 el costo de la canasta básica creció a un ritmo mucho mayor que el salario.
De la figura anterior podemos comentar que el aparato industrial nicaragüense tiene poco desarrollo.
15

1.4.2 DATOS CUALITATIVOS


Cuando la característica de interés de los elementos sea una variable cualitativa, se obtendrán de ella
lo que llamaremos datos cualitativos.
En los fenómenos cualitativos, las respuestas categóricas se pueden clasificar en tablas o gráficas.

EJEMPLO 1.12

Tabla 1.7 Importaciones realizadas por Nicaragua de 545.3 millones de dólares en bienes
intermedios en el año 2000 según la actividad ecónomica.

ACTIVIDAD ECONOMICA MONTO % ANGULO

Agricultura 78.7 14.4 52°


Industria 353.7 64.9 233°
Construcción 112.9 20.7 75°

Total 545.3 100.0 360°

Fuente: Banco Central

GRAFICA DE PASTEL O SECTORES


Se construyen en base a un círculo que representa el valor total de las distintas categorías en que se
divide un atributo, dividido este círculo en tantos sectores circulares como categorías tenga el
atributo. La magnitud del ángulo de los sectores se calcula con la siguiente fórmula:

Valor de la categoría
Angulo del sector = x 360°
Valor total de las categorías

EJEMPLO 1.13
Con los datos de la tabla 1.7 del ejemplo 1.12 obtenemos la siguiente figura.

21% 14%

Agricultura
Industria
Construcción

65%

Figura 1.7 Gráfica de pastel que ilustra las importaciones realizadas por Nicaragua según la
actividad ecónomica.
16

GRAFICA DE BARRAS
Este gráfico está constituido por un conjunto de barras o rectángulos , separados por distancias
iguales , cuyas alturas son el valor de los datos correspondientes al atributo que señalan sus bases.

EJEMPLO 1.14
Con los datos de la tabla 1.7 del ejemplo 1.12 obtenemos la siguiente figura.
Importaciones

400 353.7

300
200
112.9
78.7
100
0
Agricultura Industria Construcción
Actividad ecónomica

Figura 1.8 Gráfica de barras que ilustra las importaciones realizadas por Nicaragua según la
actividad ecónomica.

EJEMPLO 1.15
Tabla 1.8 Precios promedios en dólares de los tres principales productos de consumo: frijol, pollo
y leche a nivel centroamericano.

PRODUCTOS Costa Rica El Salvador Guatemala Honduras Nicaragua

Frijol 0.50 0.55 0.39 0.48 051


Pollo 0.94 1.02 0.93 0.72 0.80
Leche 0.40 0.87 0.59 0.47 0.42

Fuente: Banco Central de Nicaragua, Septiembre de 2000


17

EJEMPLO 1.16
Con los datos de la tabla 1.8 del ejemplo 1.15 obtenemos la siguiente figura.

1.2
1.1
1
0.9
0.8
0.7
Precios

0.6
0.5
0.4
0.3
0.2
0.1
0

C.R. E.S. G H N

Frijol Pollo Leche

Figura 1.9 Gráfica de barras que ilustra los precios promedios en dólares de los tres principales
productos de consumo: Frijol, Pollo y Leche.

Observando el gráfico anterior conteste las siguientes preguntas:


¿ Cuál es el menor precio del pollo a nivel centroamericano ?
¿ Cuál el el mayor precio de la leche a nivel centroamericano ?
¿ En qué país centroamericano la leche tiene menor precio ?
¿ En qué país centroamericano el pollo tiene mayor precio ?
¿ En Guatemala qué producto tiene menor precio ? ¿En Nicaragua qué producto tiene mayor precio?
18

1.5 CARACTERIZACION ( ANÁLISIS ) DE LOS DATOS


Aquí el investigador trata de resumir la información disponible en algunas expresiones, esto es,
valores o medidas que nos fijen el comportamiento global del fenómeno.
El análisis de los datos consiste básicamente en la determinación de dos medidas que representan
características de los datos.

 Medidas de posición
Nos indican las posiciones o lugares alrededor de los cuales se distribuyen los datos.

 Medidas de dispersión
Nos informan sobre la variabilidad de los datos alrededor de las medidas de posición.

Existen otras medidas que serán estudiadas posteriormente.

Posición Posición

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
x

Figura 1.10 Puntos sobre la recta real correspondientes a dos conjuntos de datos.

¿ Cómo se dispersan los datos y alrededor de qué posición lo hacen ?

1.5.1 MEDIDAS DE POSICION

1.5.1.1 MEDIDAS DE POSICIÓN CENTRAL


Son valores representativos que tienden a situarse en el centro de un conjunto de datos ordenados
según su magnitud.

1.5.1.1.1 LA MEDIA ARITMÉTICA

DATOS NO AGRUPADOS EN CLASES


Si x1, x2,..........,xn representan datos muestrales entonces su media muestral se denota y define así

x i
x .

Si x1, x2,..........,xN representan todos los datos poblacionales entonces su media poblacional se
denota y define así
19
N

x i
μ .

EJEMPLO 1.17
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.

20, 10, 15, 25, 20

Calcule el saldo promedio de las 5 cuentas

Elementos: cuentas
X : saldo
n=5

20  10  15  25  20 90
x   18 (en miles de C$ )
5 5

Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X utilizaremos para la media
muestral la siguiente fórmula:

x f i i
x .

EJEMPLO 1.18
Dada la distribución de frecuencias de la tabla 1.3 del ejemplo 1.2 , calcule el número promedio de
días de atraso en el pago de las cuentas.

Tabla 1.9

xi fi xifi
0 2 0
1 3 3
2 4 8
3 1 3

10 14

14
x  1.4 días
10
20

DATOS AGRUPADOS EN CLASES


Si los datos representados por la variable de interés X están agrupados en “g “ clases
consideraremos que los valores de X serán las marcas de clase, motivo por el cual escribiremos:
Para una muestra:
g

m f j j
mj: marca de la clase j
x .
n
fj: frecuencia de la clase j

Para una población:


g

m f j j
μ .

EJEMPLO 1.19
La distribución de frecuencias de gastos en energía eléctrica en córdobas durante el mes de Julio en
50 casas del barrio la Primavera de Managua es dada por la siguiente tabla
.
Tabla 1.10
fj
Gastos mj No. casas mjfj uj ujfj

75 ----- 100 87.5 4 350 -2 -8


100 ---- 125 112.5 8 900 -1 -8
125 ---- 150 137.5 15 2062.5 0 0
150 ---- 175 162.5 13 2112.5 1 13
175 ---- 200 187.5 7 1312.5 2 14
200 ---- 225 212.5 3 637.5 3 9

50 7375.0 20

Calcule el gasto promedio en energía eléctrica de las casas.

Método ordinario:
7375
x  147.50
50

Método por codificación:


Usaremos una variable de codificación uj que sólo tomará valores enteros, de tal forma que a cada
marca de clase le corresponderá un entero. La marca de clase que tenga asignado el 0 será
representada por m0. La fórmula que usaremos será la siguiente:
21

u f j j
x  m0  ( .
)c
n
20
x  137.5  ( 25)  137.5  10  147.50
50
Coloque el código 0 a la marca de clase que Ud. quiera, luego calcule x

PROPIEDADES DE LA MEDIA ARITMÉTICA

i. Todo conjunto de datos tiene una media y es única.


ii. La suma algebraica de las desviaciones de un conjunto de datos con respecto a su media es
cero.

 (x
.
i  x)  0

EJEMPLO 1.20
Comprobación de que la suma algebraica de las desviaciones de los números 1, 3, 5, 7 con respecto
a su media es cero.
Tabla 1.11

xi xi - 4
1 -3
3 -1
5 1
7 3
16
16 0 x 4
4

0 1 2 3 4 5 6 7 8
X

Figura 1.11

DESVENTAJAS DE LA MEDIA ARITMÉTICA


i. Es muy sensible a las observaciones extremas cuando éstas no están equilibradas en ambos lados.
ii. Es inadecuada si hay clases de extremo abierto.
22

1.5.1.1.2 LA MEDIANA
Para datos que contienen valores extremos es recomendable utilizar la mediana porque ésta no es
sensible a las observaciones extremas.
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos.

DATOS NO AGRUPADOS EN CLASES

Si un conjunto de datos están ordenados según su magnitud en orden creciente o decreciente


entonces la mediana la determinamos así:

i. Si n es impar entonces la mediana es el valor central

n 1
Posición:
2

ii. Si n es par la mediana es el promedio de los dos valores centrales

n n
Posiciones: y 1
2 2

EJEMPLO 1.21
Consideremos el costo en córdobas de la canasta básica de 5 ciudades:

1300, 1000, 1100, 1350, 1200


Determine la mediana.

El arreglo ordenado es: 1000, 1100, 1200, 1300, 1350

Me = 1200 Posición: 3

EJEMPLO 1.22

En 10 días un Banco tuvo 18, 13, 15, 12, 8, 3, 7, 14, 16 y 3 transacciones en moneda extranjera.
Determine la mediana.

El arreglo ordenado es: 3, 3, 7, 8, 12, 13, 14, 15, 16, 18


Posiciones: 5 y 6
12  13
Me =  12.5
2

NOTA: La mediana siempre existe y es única.

DATOS AGRUPADOS EN CLASES


23

1. Identificar la clase mediana ( k )

Es la primera clase con una frecuencia acumulada  n / 2

2. Aplicar la fórmula

n
 fa k 1
Me  Lik  ( 2 )c
fk

donde:
fa k-1 es la frecuencia acumulada de la clase que precede a la clase mediana.
Lik es el límite inferior de la clase mediana.
fk es la frecuencia de la clase mediana.
n es el número de datos.

EJEMPLO 1.23
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, calcule el gasto mediano en
energía eléctrica de las 50 casas.

fj
Gastos No. casas faj

75 ---- 100 4 4
100 ---- 125 8 12
125 ---- 150 15 27
150 ---- 175 13 40
175 ---- 200 7 47
200 ---- 225 3 50

50

1. n / 2 = 25 La primera clase con una fa.  25 es k = 3

25  12 13
2. Me  125  ( )25  125  (25)  146.6667
15 15

EJEMPLO 1.24
Los siguientes datos representan ventas anuales registradas en millones de córdobas en 80 tiendas
24

Tabla 1.12

Ventas anuales N° tiendas faj

Hasta 10 8 8
10 ---- 20 18 26
20 ---- 30 32 58
30 ---- 40 15 73
40 ---- 50 6 79
Más de 50 1 80

80

Calcule la venta anual mediana de las tiendas.

n
1. = 40 La primera clase con una fa  40 es k = 3
2

40  26 140
2. Me = 20 + ( )10 = 20 +  20  4.375  24.375
32 32

1.5.1.1.3 LA MODA
La moda de un conjunto de datos es aquel valor que se presenta con más frecuencia.
La moda no es afectada por valores extremos. Sin embargo sólo se utiliza para propósitos
descriptivos porque es más variable para distintas muestras que las demás medidas de posición.

DATOS NO AGRUPADOS EN CLASES

EJEMPLO 1.25
Los siguientes datos corresponden a ventas mensuales de una empresa registradas en millones de
córdobas durante el año pasado.

100, 80, 150, 60, 100, 90, 130, 100, 90, 100, 120, 100

¿Cuál fue la venta mensual modal de la empresa?

Mo = 100

La moda puede no existir, incluso si existe puede no ser única.

EJEMPLO 1.26
60, 74, 82, 85, 90 La moda no existe

EJEMPLO 1.27
50, 60, 70, 60, 50, 40, 80, 50, 60, 45
25

Mo = 50 y Mo = 60

DATOS AGRUPADOS EN CLASES

1. Identificar la clase modal ( k )


Es la clase con la más alta frecuencia.

2. Aplicar la fórmula

Δ1
Mo  Lik  ( )c
Δ1  Δ 2

donde:
Lik es el límite inferior de la clase modal.
1 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
precedente.
2 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
siguiente.

EJEMPLO 1.28
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, calcule el gasto modal en
energía eléctrica de las 50 casas.

fj
GASTOS No. casas

75 ---- 100 4 1  15  8  7
100 ---- 125 8
125 ---- 150 15  2  15  13  2
150 ---- 175 13
175 ---- 200 7
200 ---- 225 3

50

1. La clase con la mayor frecuencia es la tercera, esto es, k = 3


2.
7
Mo  125  ( )25  125  19.4444  144.4444
72

1.5.1.2 MEDIDAS DE POSICION NO CENTRAL


26

1.5.1.2.1 PERCENTILES
Son medidas que dividen a una distribución en cien partes iguales.
El percentil r, denotado por Pr, donde r = 1, 2, ........, 99 es el valor por debajo del cual queda el r%
de los datos.
DATOS AGRUPADOS EN CLASES
1. Identificar la clase que contiene al Pr (k)
r
Es la primera clase con una frecuencia acumulada  n( )
100

2. Aplicar la fórmula
r
n( )  fa k 1
Pr  Lik  ( 100 )c
fk
donde
n es el número de datos
Lik es el límite inferior de la clase que contiene al Pr
r
n( ) es el r% de n
100
fk es la frecuencia de la clase que contiene al Pr
fak-1 es la frecuencia acumulada de la clase que precede a la clase que contiene al Pr.

EJEMPLO 1.29
Dada la distribución de frecuencias de la tabla 1.10 del ejemplo 1.19, ¿ Por debajo de qué gasto en
energía eléctrica está el 90% de las casas ?

GASTOS fj fa

75 ----- 100 4 4
100 ----- 125 8 12
125 ----- 150 15 27
150 ----- 175 13 40
175 ----- 200 7 47
200 ----- 225 3 50

50

r 90
1. n( )  50( )  45 La primera clase con una fa.  45 es k = 5
100 100
45  40 125
2 P90  175  ( )25  175   175  17.8571  192.8571
7 7

¿ Por debajo de qué gasto en energía eléctrica está el 60% de las casas ?

1.5.2 MEDIDAS DE DISPERSION


Considere que los siguientes puntos sobre la recta real son los correspondientes a dos conjuntos de
datos.
27

Posición Posición

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Figura 1.12

¿ Cómo se dispersan los datos y alrededor de qué posición lo hacen ?


¿ Qué conjunto de datos tendría la menor variación?

Cuando la dispersión de los datos se considera pequeña en comparación a la magnitud de los datos
decimos que la medida de posición es confiable, esto es, representativa de los datos.

1.5.2.1 LA VARIANZA , LA DESVIACION ESTANDAR Y EL COEFICIENTE DE


VARIACION.

DATOS NO AGRUPADOS EN CLASES


Si x1, x2,..........,xN representan todos los datos poblacionales entonces su varianza poblacional se
denota y define así
N

 (x i  μ)2
σ2  .

La desviación estandar poblacional se denota y define así

  2

Si x1, x2,..........,xn representan datos muestrales entonces su varianza muestral se denota y define
así
Fórmula abreviada
n
n
( x i ) 2
 (x i  x) 2 n

x
2
 .
s2  . i
n
n 1 s2  .

n 1

La desviación estándar muestral se denota y define así s s2

El coeficiente de variación es una medida relativa de dispersión. Se expresa como porcentaje y es


útil cuando se compara la variabilidad de dos o más conjuntos de datos expresados en diferentes o
iguales unidades de medición.
28

s CVpob 
σ
Para una muestra CVmtra  (100) Para una población (100)
x μ

EJEMPLO 1.30
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.

20, 10, 15, 25, 20


Determine:
a) El saldo promedio de las cuentas
b) La varianza y la desviación estandar de los saldos
c) El coeficiente de variación

xi (x i  x) 2 x2i

20 4 400
10 64 100
15 9 225
25 49 625
20 4 400

90 130 1750

90
a) x  18
5
130
b) s2   32.50
4
(90) 2
1750 
s2  5  1750  1620  130  32.50  s  32,50  5.7009

4 4 4

Tanto la varianza como la desviación estándar de un conjunto de datos son medidas de variabilidad
de los datos alrededor de la media.
La desviación estándar puede interpretarse como una desviación promedio de los datos alrededor
de la media, en otras palabras, cuánto se alejan en promedio los datos de la media.

Para el ejemlo 1.30, podemos decir que la desviación promedio de los saldos de las cuentas
alrededor de C$ 18 es C$ 5.7009 o bien que los saldos se alejan en promedio C$ 5.7009 de la media.

5.7009
c) CV  (100)  31.6717%
18
Este valor no tendrá sentido a menos que lo comparemos con otro conjunto de cuentas.

Consideremos otro conjunto de cuentas:


xi (x i  x) 2 xi2
21 2.25 441
15 56.25 225
25 6.25 625
29

29 42.25 841

90 107.00 2132

90
a) x  22.50
4
(90) 2
2132 
b)
s2  4  2132  2025  107  35.6667  s 35.6667  5.9722
3 3 3
5.9722
c) CV  (100)  26.5431%
22.50
¿Qué conjunto de cuentas tiene el saldo más uniforme?

Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X, la varianza muestral se define
así

 (x i  x) 2 f i
s2  .

n 1

EJEMPLO 1.31
Para la distribución de frecuencias de la tabla 1.3 del ejemplo 1.2 , calcule la desviación estándar
del número de días de atraso en el pago de las cuentas.
Recordemos que x  1.4 días.

xi fi (x i  x) 2 f i

0 2 3.92
1 3 0.48
2 4 1.44
3 1 2.56

10 8.40

8.40
s2   0.9333  s  0.9661 ¿ Cómo interpretaría este resultado ?
9

DATOS AGRUPADOS EN CLASES


La varianza poblacional se denota y define como

mj es la marca de la clase j
g es en número de clases
30
g

 (m j  μ) 2 f j
fj es la frecuencia de la clase j
σ2  .
N

La desviación estándar poblacional se denota y define como

  2

La varianza muestral se denota y define como


Fórmula abreviada.
g
g
(  m jf j ) 2
 (m j  X) f j
2 g

m
2
fj  .
s 
2 . j
n
n 1 s2  .

n 1

La desviación estándar muestral se denota y define como

s s2

El coeficiente de variación se denota y define así

s 
Para una muestra CVmtra  (100) Para una población CVpob  (100)
x 

EJEMPLO 1.32
En la siguiente tabla se dan los rendimientos en qq / mz. obtenidos en 60 plantaciones de algodón.
Tabla 1.13
Rendimientos N° Plantaciones

20 ---- 28 4
28 ---- 36 20
36 ---- 44 30
44 ---- 52 5
52 ---- 60 1

60

1. ¿Cuál es el rendimiento promedio de las 60 plantaciones?


2. ¿Cuál es la varianza y la desviación estandar del rendimiento de las plantaciones?
3. Calcule el coeficiente de variación.

mj fj mjfj mj2fj
31

24 4 96 2304
32 20 640 20480
40 30 1200 48000
48 5 240 11520
56 1 56 3136

60 2232 85440

2232
1. x  37.20 qq/mz.
60
( 2232) 2
85440 
2. 60 85440  83030.4 2409.6
s2     40.8407
59 59 59

s 40.8407  6.3907qq/mz. ¿ Cómo interpretaría este resultado ?

6.3907
3. CV  (100)  17.1793%
37.20

Aplicando la otra fórmula

mj fj (m j  x) 2 f j

24 4 696.96
32 20 540.80
40 30 235.20
48 5 583.20
56 1 353.44

60 2409.60

2409.60
s2   40.8407
59

EJERCICIO 1.1
Para la distribución de frecuencias de gastos de energía eléctrica en córdobas, del ejemplo 1.19,
verifique que la desviación estándar del gasto de energía eléctrica es s = C$ 32.73

1.5.3 MEDIDAS DE ASIMETRIA

1.5.3.1 RELACION ENTRE MEDIA , MEDIANA Y MODA.


Las diferencias entre los valores de la media, la mediana y la moda permiten saber la forma de la
distribución de frecuencias
32

DISTRIBUCIONES SIMETRICAS
Si en una distribución de frecuencias, la media, la mediana y la moda coinciden entonces decimos
que la distribución es simétrica. Ver figura 1.13

20
15
15
10 10
10
5 5
5

Figura 1.13

DISTRIBUCIONES ASIMETRICAS
Si los valores de la media , la mediana y la moda no coinciden entonces decimos que la distribución
es asimétrica.
Para distribuciones asimétricas unimodales las posiciones relativas de las tres medidas serán tales
que la mediana estará siempre entre la media y la moda. Ver figuras 1.14 y 1.15

 Distribución asimétrica a la izquierda o negativa.

40 34
28
30 25
20
20 15

10 5 7

0
Media Me Mo

Figura 1.14

La cola mayor se extiende a la izquierda o dirección negativa y por tanto la media es la menor de
las tres medidas.
x < Me < Mo

 Distribución asimétrica a la derecha o positiva.


33

50
40
40 33
28 26
30
18
20
10
10 5
0
Mo Me Media

Figura 1.15
La cola mayor se extiende a la derecha o dirección positiva motivo por el cual la media es la mayor
de las tres medidas.
Mo < Me < x

RELACION EMPIRICA ENTRE LA MEDIA , LA MEDIANA Y LA MODA


Para distribuciones moderadamente asimétricas la mediana se aleja aproximadamente de la media
un tercio de la distancia entre la media y la moda.

 x - Mo  = 3  x - Me   Mo = 3Me - 2 x

EJEMPLO 1.33

Retomando los datos de la tabla 1.10 del ejemplo 1.19 tenemos que:

x =147.50 Me =146.6667 Mo =144.4444

Por lo tanto la distribución tiene una asimetría a la derecha.


Verifiquemos ahora la relación empírica determinando la moda:

Mo = 3 (146.6667) – 2 ( 147.50 ) = 440.0001 – 295 =145.0001

La diferencia puede deberse a errores de redondeo o bien a que la distribución no es tan


moderamente asimétrica.

1.5.3.2. COEFICIENTE DE ASIMETRIA DE PEARSON


Un indicador posible de la asimetría de una distribución es la diferencia ( x  Mo ) dividida por s,
esto es,
34

x  Mo
s
Una medida adimensional,es decir, invariable ante cambios de escala y de origen.
Pero como ( x  Mo)  3(x  Me) consideraremos, para distribuciones moderamente asimétricas y
en forma de campana, el siguiente indicador que llamaremos coeficiente de asimetría de Pearson.

3(x  Me) 3(μ  Me)


P para una muestra P para una población
s σ

Apoyándonos en este coeficiente diremos que:

Si P = 0 entonces la distribución es simétrica.


Si P  0 entonces la diatribución tiene asimetría negativa.
Si P  0 entonces la distribución tiene asimetría positiva.

EJEMPLO 1.34
Para la distribución de frecuencias de gastos de energía eléctrica en córdobas durante el mes de Julio
en 50 casas del barrio la Primavera del ejemplo 1.19 tenemos que:

3(147.50  146.6667)
P  0.0764
32.73

Por lo tanto la distribución tiene asimetría positiva.

1.5.3.3 MOMENTOS CON RESPECTO A LA MEDIA


El momento de orden r de una variable X se denota y define como
n

 (x i  x) r
, r = 0, 1, 2, .........
mr  .

Si los datos forman una distribución de frecuencias de la variable X, la expresión anterior es


equivalente a:

 (x i  x) r f i
, r = 0, 1, 2, .......
mr  .

Dando valores a r tenemos:


n

m0 = 1 , m1 = 0 ¿Por qué? , m2 =
n 1 2
s , m3 =  (x
.
i  x) 3 f i
n
n

1.5.3.4 COEFICIENTE DE ASIMETRIA DE FISHER


El coeficiente de asimetría de Fisher se denota y define como:
35

m3 m3
F para una muestra F para una población
s3 3

Hemos dividido m3 por s3 para que F sea un número sin dimensiones


Apoyándonos en este coeficiente diremos que:

Si F = 0 , la distribución es simétrica.
Si F  0 , la distribución tiene asimetría negativa.
Si F  0 , la distribución tiene asimetría positiva.

EJEMPLO 1.35
El número de empleados de 10 pequeñas empresas fue el siguiente:

2, 3, 3, 4, 4, 4, 4, 5, ,5, 6

Calcular el coeficiente de asimetría de Fisher.

xi fi xifi (x i  x) 2 f i (x i  x) 3 f i (x i  x) 4 f i

2 1 2 4 -8 16
3 2 6 2 -2 2
4 4 16 0 0 0
5 2 10 2 2 2
6 1 6 4 8 16

10 40 12 0 36

40 12
x  4 empleados s2   1.3333  s  1.1547 empleados
10 9

0 m3 0 0
m3  0 F 3
 3
 0 Por lo tanto la distribución es simétrica.
10 s 1.1547 1.5396

La regla empírica
En un conjunto de datos moderamente asimétricos aproximadamente el 67% de los datos (la
mayoría de los datos) están comprendidos dentro de la distancia de una desviación estándar en
torno a la media, y aproximadamente entre un 90% y 95% de los datos están comprendidos dentro
de la distancia de dos desviaciones estándar en torno a la media.
Para el ejemplo 1.35 podemos decir que aproximadamente un 67% de las pequeñas empresas (la
mayoría de las pequeñas empresas) tienen un número de empleados que varían entre 4 – 1.1547 =
2.8453 empleados y 4 + 1.1547 = 5.1547 empleados.

1.5.4 MEDIDAS DE CURTOSIS


36

Una vez que la asimetría ha sido determinada, podremos preguntarnos si la distribución es más o
menos apuntada. Este apuntamiento habrá que medirlo comparándolo con cierta distribución de
frecuencias que consideramos normal.

1.5.4.1 COEFICIENTE DE APLASTAMIENTO DE FISHER


Denotamos y definimos el coeficiente de Fisher como

m4 m4
K 3 para una muestra K 3 para una población
s4 4

donde m4 es el momento de cuarto orden y K es también una medida adimensional


Atendiendo al valor de K se clasifican las distribucioes de frecuencias en:

 Mesocúrtica: cuando K = 0 , es decir si es tan apuntada como la normal.


 Platicúrtica: cuando K  0 , es decir es menos apuntada que la normal.
 Leptocúrtica: cuando K  0 , es decir es más apuntada que la normal.

Ver figura 1.16

EJEMPLO 1.36
Para el número de empleados de las 10 pequeñas empresas tenemos que

m4 3.6 3.6
K 4
3 4
3  3  2.0250  3  0.9750
s 1.1547 1.7778

La distribución es levemente platicúrtica.

Leptocúrtica

Mesocúrtica

Platicúrtica

Figura 1.16

EJERCICIOS PROPUESTOS DEL TEMA 1:ESTADISTICA DESCRIPTIVA


37

1. Escriba la letra correspondiente a la par de cada enunciado en el paréntesis.

1.1. Identifique cual es la muestra (M) y cual es la población (P).


a) Se extrae 100 tornillos de los que produce determinada fábrica en un día determinado ( )
b) Obtenemos las calificaciones de todos los estudiantes de la Facultad de Ciencias
Económicas ( )
c) Obtenemos la información de las horas trabajadas en un día por los obreros de la
Zona Franca. ( )
d) Extraemos dos galones de gasolina de un tanque de 500 galones para que sean
examinados ( )

1.2. Señale con una A las series constituidas por datos cualitativos (o atributos) y con una V los
datos cuantitativos.

a) Preferencia políticas (izquierda, derecha o centro). ( )


b) Marcas de galletas ( )
c) El peso en libras ( )
d) Velocidad en km/h ( )
e) Nivel educativo (primario, secundario, universitario) ( )
f) Número de empleados de una empresas. ( )
g) Años de antigüedad laboral. ( )
h) La clase social (bajo, media o alta) ( )

1.3. Señale cual de las siguientes variables son continuas ( C ) y cuales son discretas ( D ).

a) Cantidad de quintales de café cortados . ( )


b) Cantidad de cajas de fósforos en un determinado conteo físico ( )
c) Galones de gasolina consumidos por un automóvil en una semana ( )
d) Cantidad de camisas vendidas diariamente ( )
e) Tiempo de vida de los bombillos eléctricos ( )

2. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar cada una de
sus cuentas de créditos. Se han obtenido los siguientes 30 registros:

17 57 10 35 26 3
21 11 7 72 5 86
6 20 95 40 14 42
12 32 28 13 19 28
45 8 19 21 38 20

a) Construya una distribución de frecuencias que contenga 5 clases.


b) Grafique el histograma, el polígono de frecuencias y la ojiva.
c) Calcule la media aritmética, la mediana, la moda, la desviación estándar y el coeficiente
de variación. Interprete los resultados.
38

3. La gran variedad de factores a considerar en la compra de una vivienda, lugar, precio, tasa de
amortización, tipo de construcción y otros hacen que el tiempo que un comprador tarda en llegar a
su decisión final sea muy variable. Los siguientes datos representan la duración de la búsqueda (en
semanas) de 25 compradores de vivienda en cierta población.

15 17 7 15 20
5 3 19 10 3
11 10 4 8 13
9 15 6 2 8
12 1 2 13 4

a) Construya un histograma de frecuencias que contenga 6 clases.


b) ¿Qué le dice a usted esta descripción gráfica acerca del tiempo de búsqueda que invierten los
compradores de vivienda?

4. Los siguientes datos representan las declaraciones mensuales de impuestos sobre ventas (en
miles de córdobas) que los 30 establecimientos comerciales de la ciudad A presentaron ante el
correspondiente contralor.

9.0 10.3 11.1 9.6 14.5 13.0 6.7 11.0 8.4 10.3
13.0 11.2 7.3 5.3 12.5 8.0 11.8 8.7 10.6 9.5
11.1 10.2 9.9 9.8 11.6 15.1 12.5 14.0 8.6 5.3

a) Organice los datos anteriores en una distribución de frecuencias que contenga 5 clases.
b) Grafique el histograma de frecuencias y la ojiva.

5. La revisión de 8 documentos reveló el siguiente número de equivocaciones en cada uno:

2, 4, 2, 3, 2, 0, 1, 0

Determine:
a) El número promedio de equivocaciones.
b) El número mediano de equivocaciones.
c) El número modal de equivocaciones.
d) La desviación estándar del número de equivocaciones.
39

6. Una empresa industrial agrupó sus fábricas de acuerdo con el valor de la producción anual de
cada una; se obtuvo la siguiente distribución:

Producción (en millones de C$) No. de fábricas


40-45 7
45-50 10
50-55 11
55-60 9
60-65 8
65-70 7

a) Determine la producción anual promedio de las fábricas.


b) Determine la desviación estándar de las producciones.
c) Calcule el coeficiente de variación.
d) ¿Por debajo de qué valor producen el 70% de las fábricas?
e) Calcule el coeficiente de asimetría de Pearson y diga qué tipo de asimetría tiene la
distribución

7. Durante un período de 15 años, los precios promedios de cierto producto fueron de C$ 125, con
una desviación estándar de C$ 25. En un período posterior de 12 años, tuvieron un precio promedio
de C$ 80 con una varianza de C$ 100. ¿En qué período hubo mayor estabilidad de precios?.

8. Los salarios por día en dólares de 5 obreros son dados a continuación:

2.50 3.90 3.20 4.20 y 3.70


a) Calcule la suma algebraica de las desviaciones de cada salario con respecto a la media
aritmética.
b) Calcule el salario mediano.

9. Dos países A y B venden la misma materia prima en el mercado mundial a los siguientes precio
por kilogramo, en el transcurso de 6 meses:

Cotizaciones en C$ por país


Mes A B
1 4.9 2.9
2 5.0 3.8
3 2.6 3.0
4 4.5 3.5
5 2.3 3.7
6 4.1 5.0

Realice un análisis de los precios de este producto para ambos países.


Sugerencia : Compare los coeficientes de variación y diga a qué país se le presentan condiciones de
mercado más favorable.
40

10. La tabla siguiente muestra la distribución por edades de cabezas de familia en un país dado
durante el año 2000.

Edad de años Número (en millones)


Hasta 25 2.22
25 a 30 4.05
30 a 35 5.08
35 a 40 10.45
40 a 45 9.47
45 a 50 6.63
50 a 55 4.16
Más de 55 1.66

a) Determine la edad mediana y modal.


b) ¿Por qué la mediana es una medida más adecuada que la media aritmética en este caso?

11. El contador de un almacén desea estimar el balance promedio, en dólares de las 10,000 cuentas de crédito que
maneja el almacén. La distribución de frecuencias se representa en la tabla y fue construida a partir de una muestra de
100 cuentas seleccionadas al azar en los archivos de crédito del almacén.
Balance de la Cuenta N° de cuentas
0 – 20 10
20 – 40 15
40 – 60 40
60 – 80 22
80 – 100 13
100

a) Grafique:
Histograma, Polígono de frecuencias relativa, Polígono de frecuencia acumulada.
b) Calcule:
La media aritmética, La mediana, La moda
La varianza, desviación estándar y coeficiente de variación.
c) Calcule el coeficiente de asimetría de Pearson, y diga que tipo de asimetría tiene la distribución.

12. El resultado del ordeño de 100 vacas durante una semana computadas las cantidades diarias de
leche obtenidas por cada vaca, fue agrupada según la siguiente distribución.

Cantidad de litros semanales Número de vacas


60-62 5
62-64 18
64-66 42
66-68 27
68-70 8

Calcule:
1. El rendimiento promedio semanal de leche por vaca.
41

2. El rendimiento mas frecuente.


3. La cantidad de leche por debajo de la cual produce el 80% de las vacas.
4. La desviación estándar del rendimiento semanal de leche.
5. Calcule el coeficiente de asimetría de Pearson, luego diga que tipo de asimetría tiene la
distribución.

13. La tabla de distribución de frecuencia de la tasa de desempleo en una muestra de 20 grandes


ciudades en 1999 se presenta a continuación.

Tasa de desempleo N° de ciudades


7.0-7.5 2
7.5-8.0 4
8.0-8.5 5
8.5-9.0 4
9.0-9.5 3
9.5-10 2
20

a) construya el histograma y el polígono de frecuencia acumuladas (ojiva )


b) calcule la media aritmética, la mediana, la moda, la desviación estándar y el coeficiente
de variación. Interprete los resultados.
14. Se ha recogido el número de hoteles de lujo en 20 ciudades de un país, obteniéndose la siguiente
tabla:

N° de hoteles 0 1 2 3
N° Ciudades 2 3 10 5

a) Represente gráficamente la distribución.


b) Calcule el número promedio de hoteles y la desviación estándar del número de hoteles.
c) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la
distribución.
d) Diga que tan apuntada es la distribución.

15. Los siguientes datos representan el número de interrupciones en 15 días de trabajo debidas a
fallas mecánicas en una planta procesadora de alimentos:

3 0 5 1 3 1 3 2 2 0 2 1 2 4 3
a) Resuma los datos en una distribución de frecuencias.
b) Calcule el número promedio de interrupciones y la desviación estándar del número de
interrupciones.
c) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la
distribución.
d) Calcule el coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

16. Una autoridad urbana desea diseñar una gráfica que muestre a los contribuyentes que asiten a la
próxima reunión, lo que sucede con el dinero que pagan por impuestos. El monto total recolectado
42

es de C$ 2 millones (de córdobas). Los gastos fueron: C$ 440,000 para escuelas, C$ 1160,000 para
caminos, C$ 320,000 para administración y C$ 80,000 para suministros. Una gráfica de sectores
parece ideal para mostrar el porcentaje de los impuestos que se dedica a caminos, escuelas,
administración y suministros. Convierta las cantidades totales a porcentajes del total general y
represente los porcentajes en una gráfica de pastel.

17. En el Anuario Estadístico 1997 se señala que el valor total de todos los bienes y servicios
producidos en Nicaragua, era de 21 mil millones de córdobas incluyendo todos los sectores de la
economía.

Sector económico Porcentaje del PIB de Nic. En 1997

Primarios 21.67
Secundarios 30.48
Terciarios 47.85

T O T A L 100.00

a) Construya una gráfica de barras.


b) Construya una gráfica de pastel.

18. La siguiente tabla refleja el valor de las exportaciones e importaciones en millones de US $


realizadas por Nicaragua de 1993 a 1997.

Años

Concepto 1993 1994 1995 1996 1997

Exportaciones 452 412 305 257 295

Importaciones 807 826 892 761 824

a) Construya una gráfica de barras.


b) Construya una gráfica lineal donde puedan compararse las exportaciones y las importaciones
43

TEMA 2. PROBABILIDADES

OBJETIVOS.

1. Construir espacios muestrales y eventos asociados a un experimento aleatorio.


2. Interpretar el concepto de probabilidad de que ocurra un evento y describir los enfoques de
probabilidad.
3. Calcular probabilidades aplicando las reglas de complemento, adición y multiplicación.
4. Calcular probabilidades aplicando los conceptos de probabilidad condicional, regla de la
multiplicación e independencia de eventos.
5. Resolver problemas aplicando el teorema de Bayes.

2.1 INTRODUCCION
Debido a l a tolerancia de varias formas de juegos para recreación de la nobleza de Francia e
Inglaterra a mediados del XVII, se suscitó un interés intenso por los juegos de azar, lo cual
permitió que matemáticos como Blaise Pascal, Pierre de Fermat, Jacob Bernoulli, Abraham
de Moire y Thomas Bayes desarrollaran la teoría de las probabilidades.
Como vivimos en un mundo donde somos incapaces de pronosticar el futuro con absoluta certeza, la
necesidad de sortear la incertidumbre nos lleva a estudiar la teoría de probabilidades para
conocer las reglas que nos permitirán estudiar los fenómenos aleatorios.
En la actualidad la teoría de la probabilidad constituye el fundamento de la Estadística Inferencial,
una rama de la Estadística con importantes aplicaciones a situaciones en que interviene la
incertidumbre. En tales circunstancias la Estadística Inferencial permitirá hacer estimaciones de
parámetros basados en la información muestral. Ver aplicaciones de la Estadística en Auditoría,
marketing y Control de calidad.
Comenzaremos este tema estudiando la terminología que usaremos

EXPERIMENTO ALEATORIO ()


Es aquel que al repetirse bajo condiciones aproximadamente idénticas el resultado no es
necesariamente el mismo.
Podríamos decir que todos los juegos de azar son experimentos aleatorios

 Lanzar un dado y observar el número de puntos que aparecen en la cara superior.


 Elegir al azar un naipe de la baraja común de 52 naipes.
 Lanzar una moneda y observar la cara superior.

La característica principal de estos experimentos es la existencia de incertidumbre en el resultado


que se puede obtener al realizar el fenómeno.
También existen otros experimentos que son considerados de naturaleza aleatoria:

EJEMPLO 2.1
1: Un contador revisa 10 facturas de una empresa. Luego cuenta el número de facturas con algún
error en su valor total.

EJEMPLO 2.2
2: De una lista formada por todas las cuentas de ahorro de un Banco, seleccionar al azar una y luego
anotar su vida actual.
44

EL ESPACIO MUESTRAL ( S ) ASOCIADO A UN EXPERIMENTO


Es el conjunto de todos los resultados posibles del experimento.
A cada elemento de este conjunto le llamaremos punto muestral.
Para el ejemplo 2.1

S1 = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }

Aquí decimos que S1 es un espacio muestral discreto porque sus resultados están representados por
valores que tienen interrupción.
Para el ejemplo 2.2
Supongamos una vida máxima registrada en el Banco de 15 años

S2 = ( 0, 15 ]

Aquí S2 es un espacio muestral contínuo porque sus resultados están representados por valores que
no tienen interrupción, es decir , que entre dos resultados posibles siempre existe otro.

EVENTOS
Un evento A respecto a espacio muestral S es un conjunto de resultados posibles del experimento,
esto es, A  S

S
A

Figura 2.1
Para el ejemplo 2.1
Consideremos que el evento A representa “cuenta a lo más 3 facturas con algún error.”

Entonces A = { 0, 1, 2, 3 }

Decimos que un evento A ha ocurrido si el resultado del experimento es un elemento de A.

¿De cuántas maneras puede ocurrir un evento A?

Si #A representa el número de maneras que puede ocurrir el evento A, entonces #A = 4


NOTA. Si S tiene k elementos entonces hay 2k eventos respecto a S

TIPOS DE EVENTOS

Evento imposible ( )
Es un evento que nunca ocurre.   S
Para el ejemplo 2.1
Supongamos que el evento F representa “cuenta 12 facturas con algún error” , entonces F = 
45

Evento seguro (S )
Es un evento que siempre ocurre.
Para el ejemplo 2.1
El evento S1 es un evento seguro.

Evento simple
Es el que describe solamente una carácterística.
Para el ejemplo 2.1
El evento A es simple.

Evento conjunto
Es el que describe dos o más características.
El evento conjunto de A y B denotado por AB ocurre cuando A y B ocurren juntos.
Para el ejemplo 2.1
Supongamos que el evento B representa “cuenta un número impar de facturas con algún error”, esto
es,
B = { 1, 3, 5, 7, 9 }
Entonces
AB representa “cuenta a lo más 3 y un número impar de facturas con algún error.”

AB = { 1, 3 } es un evento conjunto y #(AB) = 2

S
A B
AB

Figura 2.2

Evento unión
El evento unión de A y B denotado por AB es aquel que ocurre si A ocurre ó B ocurre ó si ocurren
ambos.

Para el ejemplo 2.1


AB representa “cuenta a lo más 3 ó un número impar de facturas con algún error.”

AB = { 0, 1, 2, 3, 5, 7, 9 } y #(AB) = 7
46

Evento complementario
El evento complementario de A denotado por A’ es aquel que ocurre si A no ocurre.

A’ S
A

Figura 2.3

Para el ejemplo 2.1


A’ representará lo contrario de A, esto es, A’ representa “cuenta al menos 4 facturas con algún
error.”
A = { 4, 5, 6, 7, 8, 9, 10 }

NOTA: AA’ =  y AA’ = S

EVENTOS MUTUAMENTE EXCLUYENTES


Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir simultáneamente , esto es, si

AB = 

Para el ejemplo 2.2


Supogamos que el evento M representa “la cuenta tiene más de 3 años y 4 meses” y el evento R
representa “ la cuenta tiene menos de 5 años.”
Son los eventos M y R mutuamente excluyentes? No porque MR  

EVENTOS COLECTIVAMENTE EXHAUSTIVOS


Los eventos A1, A2, ..........., An son colectivamente exhaustivos si A1A2 ............An = S
Esto es, si por lo menos uno de ellos debe ocurrir durante un experimento.

Para el ejemplo 2.2


Supongamos que el evento A1 representa “ la cuenta tiene menos de 1 año” y que el evento
A2 representa “la cuenta tiene por lo menos 1 año.”
Estos eventos son mutuamente excluyentes y colectivamente exhaustivos.

2.2 ENFOQUES DE PROBABILIDAD


El propósito de la teoría de probabilidad es asignar un número a cada evento A, el cual llamaremos
probabilidad de que ocurra A y lo denotaremos así

P(A)

La probabilidad de cualquier evento indicará que tan factible es que ocurra el evento, entre mayor
sea la probabilidad, más grande será la factibilidad de que ocurra el evento.
Ahora estaremos interesados en cómo obtener P(A)
47

2.2.1 ENFOQUE DE PROBABILIDAD CLASICA A PRIORI


Aquí suponemos que el experimento no se realiza y que además todos los resultados posibles del
experimento se consideran igualmente probables.
Según la historia es la manera más antigua de medir incertidumbre, teniendo su origen en los juegos
de azar.
Número de maneras que puede ocurrir A #A
P(A) = =
Número de resultados posibles del experimento #S

EJEMPLO 2.3
Una empresa tiene 200 cuentas por cobrar de las cuales se sabe que 50 tienen un saldo menor que
C$ 12000. Un auditor selecciona una al azar, ¿ cuál es la probabilidad de que tenga un saldo menor
que C$ 12000 ?

Supongamos que el evento A representa que la cuenta tiene un saldo menor que C$12000.
50
Entonces P(A) =  0.25
200

2.2.2 ENFOQUE DE PROBABILIDAD CLASICA A POSTERIORI (EMPIRICA)

Aquí suponemos que el experimento se realizó un número n (suficientemente grande) de veces del
cual se observó el número x veces que ocurrió el evento A. De manera que esta probabilidad puede
verse como una frecuencia relativa observada del evento A obtenida de repetir el experimento un
número grande de veces.

Número de veces que ocurrió A x


P( A ) = =
Número de veces que se repitió el experimento n

EJEMPLO 2.4
La demanda de un artículo durante 360 días de cierto año ha sido la siguiente:

Tabla 2.1

N° artículos N° días

1 100
2 40
3 90
4 50
5 80

360

Suponiendo que el comportamiento de la demanda para el próximo año será similar al anterior,
¿cuál es la probabilidad de que cierto día:
48

i) la demanda sea de 4 artículos


Supongamos que el evento A representa que la demanda es de 4 artículos

50
P(A)   0.1389
360

ii) la demanda sea de por lo menos 3 artículos


Supongamos que el evento B representa que la demanda es de por los menos 3 artículos
220
P (B)   0.6111
360

2.2.3 ENFOQUE DE PROBABILIDAD SUBJETIVA

Se basa en una combinación de la experiencia, la opinión personal y el análisis de una situación en


particular. Es útil cuando no se pueden utilizar los enfoques anteriores.

EJEMPLO 2.5
Suponga que un profesor de Estadística quiere determinar la probabilidad de que un determinado
estudiante de su clase pase el primer parcial.
Basado en lo que sabe del estudiante sobre:
i) La disciplina que muestra en clase
ii) Las preguntas que hace durante la clase
iii) Las respuestas que da cuando se le pregunta
iv) Las evaluaciones obtenidas en los sistemáticos
v) El grado de interés o esfuerzo que muestra en comprenderle a la asignatura

El profesor estima una probabilidad de 0.80 de que pase el primer parcial.

2.3 REGLAS BASICAS DE PROBABILIDAD

1. P ( ) = 0 y P(S)=1

2. Para cualquier evento A, 0  P( A )  1

3. Si A y B son eventos mutuamente excluyentes entonces

P( A  B ) = P( A) + P( B )

4. Regla del complemento.


P(A) + P( A’ ) = 1  P( A’ ) = 1 – P( A )

5. Regla de la adición.
Sean A y B eventos cualesquiera

P( A  B ) = P( A ) + P( B ) – P( A  B )
49

EJEMPLO 2.6
Supongamos que para cierto día de negociaciones de una acción, los siguientes eventos:
A representa que el precio se mantiene sin cambios
B representa que el precio sube

Consideremos que P(A) = 0.64 y P( B ) = 0.21

Cuál es la probabilidad de que:


i) el precio cambie

Supongamos que el evento A’ representa que el precio cambia

P( A’ ) = 1 – P( A ) = 1 – 0.64 = 0.36

ii) el precio se mantiene sin cambios y el precio sube.

P( A B ) = P(  ) = 0

iii) el precio se mantiene sin cambios o el precio sube.

P(A  B ) = P( A ) + P( B ) = 0.64 + 0.21 = 0.85

EJEMPLO 2.7
En una ciudad se seleccionó una muestra de 500 personas para determinar diversas informaciones
relacionadas con el comportamiento del consumidor. Entre las preguntas hechas, se encontraba
“¿Prefiere comprar productos nacionales o importados? ”. De 240 hombres 104 contestaron que
preferían productos nacionales. De 260 mujeres 36 preferían productos nacionales.

1) Elabore una tabla de contingencia ( o de clasificación cruzada )

Tabla 2.2

( N ) Nacionales ( I ) Importados Total

( H ) Hombre 104 136 240


( M ) Mujer 36 224 260

Total 140 360 500

2) Se selecciona al azar un entrevistado, determinar la probabilidad de que:

i) sea mujer
#M 260
P( M ) =   0.52
#S 500
50

ii) sea hombre

P( H ) = 1 – P( M ) = 1 – 0.52 = 0.48

iii) prefiera comprar productos importados

360
P( I ) =  0.72
500

iv) sea hombre y prefiera comprar productos importados

# (H  I ) 136
P( H I ) =   0.272
#S 500
v) sea mujer o prefiera productos nacionales

260 140 36 364


P( M  N ) =     0.728
500 500 500 500

vi) sea hombre o mujer vii) sea hombre y mujer

P( H  M ) = P( H ) + P( M ) = 0.48 + 0.52 = 1 P(H M ) = P(  ) = 0

2.4 PROBABILIDAD CONDICIONAL


La probabilidad de que un evento A ocurra supuesto que otro evento B ha ocurrido se denota y
define como:
Probabilidad conjunta de A y B
P(A  B)
P(A | B)  =
P(B)
Probabilidad marginal de B

Mide en cierto sentido la probabilidad relativa de A con respecto al espacio reducido B

# (A  B)
Si B es finito entonces P(A | B) 
#B

S
B
A A B

Figura 2.4
51

EJEMPLO 2.8
Para el ejemplo 2.7
viii) Suponga que el entrevistado seleccionado es mujer, ¿ cuál es la probabilidad de que
prefiera comprar productos nacionales
36
P(N  M) 500 36
P( N  M ) =    0.1385
P(M) 260 260
500
# (N  M) 36
P( N M ) =   0.1385
#M 260

ix) Suponga que el entrevistado seleccionado prefiere comprar productos importados , ¿cuál es
la probabilidad de que sea hombre?

# (H  I) 136
P( H  I ) =   0.3778
#I 360

2.4.1 REGLA DE LA MULTIPLICACION


Sean A1 y A2 eventos

P(A1  A 2 )
Sabemos que P(A 2 | A1 )   P(A1  A 2 )  P(A 1 )P(A 2 A1 )
P(A1 )

La probabilidad de A1 A2 es igual a la probabilidad del primer evento A 1 por la probabilidad del
segundo evento A2 dado que el primer evento A1 ya ocurrió.

2.4.2 INDEPENDENCIA ESTADISTICA


Dos eventos A1 y A2 son independientes si y sólo si

P(A1 A2 ) = P( A1 ) ó P(A2 A1 ) = P(A2)

Si dos eventos A1 y A2 son eventos independientes entonces según la regla de la multiplicación

P( A1 A2 ) = P(A1 ) P(A2 )

EJEMPLO 2.9
Para el ejemplo 2.7

x) Determinar si la preferencia por productos importados es estadísticamente independiente del


evento ser hombre.
Comprobemos si P( H ) = P( H I )

Sabemos que P( H ) = 0.48 y que P( H  I ) = 0.3778 Luego H, I no son eventos


independientes.
52

EJEMPLO 2.10
Durante un período específico , el 80% de las acciones ordinarias de una industria que tiene 10
acciones, han aumentado en valor comercial.
Un inversionista selecciona aleatoriamente 2 de esas acciones:

1) Elabore un árbol de probabilidad que describa gráficamente la secuencia de las dos


selecciones

Consideremos los siguientes eventos:


A: ha aumentado en valor , N: no ha aumentado en valor
donde el subíndice indicará la posición secuencial de la acción.
Como el 80% de 10 es 8, entonces hay 8 acciones que han aumentado en valor y 2 que no han
aumentado en valor.

7/9 A2 ( 8/10 )( 7/9 ) = 56/90 = 0.6222

A1
8/10
2/9 N2 (8/10 )( 2/9 ) = 16/90 = 0.1778

8/9 A2 (2/10 )( 8/9 ) = 16/90 = 0.1778


2/10
N1
1/9 N2

Figura 2.5

2) ¿Cuál es la probabilidad de que:

i i) ambas hayan aumentado en valor comercial ?


8 7 56
P( ambas hayan aumentado ) = P(A1 A2) = P( A1)P(A2 | A1 ) =    0.6222
10 9 90
ii ii) una haya aumentado en valor comercial ?

P( una haya aumentado ) = P( A1 N2 ) + P( N1 A2 )

= P(A1)P(N2 | A1) + P( N1)P( A2 | N1) Regla de la multiplicación.

8 2 2 8 16 16 32
=        0.3556
10 9 10 9 90 90 90
53

2.5 TEOREMA DE LA PROBABILIDAD TOTAL

Supongamos un experimento aleatorio con su correspondiente espacio muestral S, decimos que los
eventos A1 , A2 ,.........., An forman una partición del espacio muestral S, si se cumple que:

i) Ai  Aj =  para todo i  j
ii) A1 A2  .......... An = S

y que B es otro evento respecto a S.

Entonces P(B) = P(A1)P(BA1) + P(A2)P(BA2) + ......... + P(An)P(B | An)


n
=  P(A )P(B A )
.
i i

Cada vez que se realice el experimento aleatorio anterior podemos presentar mediante un árbol de
probabilidad todos sus resultados posibles con sus correspondientes probabilidades.

P(BA1) B
A1
P(A1) B’

P(A2) P(BA2) B
A2
B’
. .
P(An) . .
. .
.
. P(BA ) n B
An
B’

Figura 2.6

2.6 TEOREMA DE BAYES


Queremos saber ahora , cuál es la probabilidad de que Ai sea la causa de la ocurrencia de B.

P(A i )P(B A i ) P(A i )P(B A i )


P(A i B)  n

P(B)
 P(A )P(B A )
.
i i
54

EJEMPLO 2.11
Un gerente de crédito clasifica las cuentas a su cargo en 3 tipos:
Tipo 1: buen pagador Tipo 2: pagador atrasado Tipo 3: mal pagador
De los archivos se estima que el 75%, 20% y 5% de las cuentas caen en las categorías 1, 2 y 3
respectivamente. Por experiencia en el trabajo el gerente considera que el 90% de los clientes con
cuentas del tipo 1 tienen casa propia, mientras que el 50% de los clientes con cuentas del tipo 2 y el
20% de los clientes con cuentas del tipo 3 tienen casa propia.
i) ¿ Cuál es la probabilidad de que una nueva aplicación de crédito corresponda a un cliente con
casa propia ?
ii) Suponga que la nueva aplicación corresponde a un cliente con casa propia, ¿ cuál es la
probabilidad de que sea pagador atrasado?

Consideremos los siguientes eventos:


S: todas las cuentas a cargo del gerente
A1: la cuenta es del tipo 1 A1, A2, A3 forman una partición de S
A2 : la cuenta es del tipo 2
A3: la cuenta es del tipo 3
B: el cliente tiene casa propia.

0.90 B 0.75(0.90) = 0.675


A1
0.10 B’
0.75
0.20 0.50 B 0.20(0.50) = 0.100
A2
0.50 B’
0.05
0.20 B 0.05(0.20) = 0.010
A3
0.80 B’
0.785
Figura 2.7

i)
P(B) = P(A1) P(BA1) + P(A2) P(BA2) + P(A3) P(BA3)
= 0.75(0.90) + 0.20(0.50) + 0.05(0.20) = 0.785

ii)
P ( A2 ) P( B | A2 ) 0.20(0.50)
P(A2B) =   0.1274
P( B) 0.785

EJERCICIO 2.1
El departamento de crédito de una tienda informó que el 30% de sus ventas son en efectivo, el 30%
se pagan con cheques y el 40% son al crédito. Se tiene información de que las compras por más de
C$ 500 en efectivo, con cheques y al crédito son el 25%, 90% y 60% respectivamente
Un persona acaba de decidir comprar un artículo cuyo precio es de C$ 800, ¿ cuál es la probabilidad
de que pague con cheque ?
55

EJERCICIOS PROPUESTOS DEL TEMA 2: PROBABILIDADES

1. Para cada una de las siguientes situaciones, indique cuál de los enfoques (clásico a priori,
clásico empírico o subjetivo) sería más útil para determinar el valor de probabilidad adecuado.

a) La probabilidad de que de un envío de 20 repuestos, del cual se sabe que 3 son defectuosos,
un repuesto escogido aleatoriamente resulte defectuoso.

b) La probabilidad de que haya una recesión el año entrante.

c) La probabilidad de que la demanda de un artículo, que produce una empresa, sea de 400
unidades para el próximo mes.

d) La probabilidad de que un liberal gane la siguiente elección presidencial en Nicaragua.

e) La probabilidad de que el dólar se cotice a C$ 15 a finales de este año.

f) La probabilidad de que al seleccionar al azar una persona de una clase, que tiene 20 mujeres
y 8 hombres, el resultado sea una mujer.

g) La probabilidad de que las ventas de un artículo que producen una fabrica suban debido al
nuevo nombre.

2. Para cada uno de los siguientes casos, diga si los eventos que se crean son (i) mutuamente
excluyentes, (ii) colectivamente exhaustivos.

a) A los votantes registrados se les preguntó si son liberales o sandinistas.


b) Los encuestados se clasificaron como propietarios de automóviles en las categorías
norteamericano, europeo, japonés, ninguno.
c) A las personas se les preguntó: “¿Actualmente vive en (i) un apartamento (ii) una casa?”.
d) Un producto se clasificó como: (i) defectuoso (ii) no defectuoso.
e) A las personas se les preguntó “ ¿tiene intención de comprar un televisor a colores en los
siguientes seis meses ?” (i) si, (ii) no.
f) un país obtuvo un crecimiento económico del (i) 5% al año (ii) 7% al año.
g) Se clasificaron las ventas anuales en (i) a lo más cinco millones de córdobas (ii) de más de
cinco a diez millones (iii) de más de diez millones.
h) En un tipo de industria se clasifican las utilidades anuales en (i) entre uno y siete millones
de córdobas (ii) de cinco millones o más.
i) En una fábrica se clasifican las partes defectuosas de la producción en: (i) menos del 7%.
(ii) más del 2%, (iii) igual al 5% de la producción.
j) La situación económica de un país se describe: (i) crecimiento real del PIB del 3% anual,
(ii) inflación 7% por año (iii) desempleo del 8% de la fuerza laboral.

3. Determine el valor de probabilidad aplicable a cada una de las siguientes situaciones: Luego
diga qué enfoque utilizo.

a) La probabilidad de seleccionar aleatoriamente una cuenta por cobrar que está en mora, si el
5% de las cuentas están en mora.
56

b) La probabilidad de que una sucursal de una cadena de restaurantes tenga éxito financiero.

El presunto inversionista obtiene información sobre otras sucursales de la cadena, estudia el


área donde se localizará la sucursal y considera el volumen de ventas necesario para el éxito
financiero. Globalmente, el inversionista cree que hay un 80% de posibilidades de que la
sucursal tenga éxito financiero y un 20% de lo contrario.

c) La probabilidad de accidentes de trabajo en una industria determinada sobre una base anual.
Una muestra al azar de 10 firmas que emplean un total de 8000 personas demostró que
ocurrieron 400 accidentes de trabajo durante un período reciente de 12 meses.

4. La probabilidad de que una nueva política de mercadeo tenga éxito (S) se calculó en 0.60. la
probabilidad de que los gastos para desarrollar la política de mercadeo puedan mantenerse dentro
del presupuesto inicial (B) es 0.50. la probabilidad de que se logren los dos objetivos es 0.30.

a) ¿Cuál es la probabilidad de que se logre por lo menos uno de estos objetivos?


b) ¿Cuál es la probabilidad de que la nueva política de mercado tenga éxito dado que el costo
de desarrollo se mantuvo dentro del presupuesto inicial.
c) ¿Son los eventos S y B estadísticamente independientes?

5. De 12 cuentas de un archivo, 4 contienen un error de procedimiento al contabilizar los saldos de


las cuentas.
Si un auditor selecciona aleatoriamente:

a) una cuenta, ¿Cuál es la probabilidad de contenga error de procedimiento?.


b) Dos cuentas (sin reposición),
i) ¿ Cuál es la probabilidad de que ninguna cuenta contenga error de procedimiento ?
Elabore un árbol de probabilidad para representar éste proceso secuencial de muestreo.
ii) ¿Cuál es la probabilidad de que una cuenta contenga error de procedimiento?

c) Tres cuentas (sin reposición), ¿Cuál es la probabilidad de que todas contengan error de
procedimiento?

6. De 100 personas que solicitaron empleo de operador de computadoras en una firma el año
pasado, 40 tenían experiencia anterior (E), 30 tenían certificado ( C ), y 20 tenían experiencia
anterior y certificado.

a) Elabore un diagrama de Venn para describir gráficamente estos eventos.

b) ¿Cuál es la probabilidad de que un solicitante escogido aleatoriamente:


i) Tenga experiencia o certificado.
ii) No tenga certificado.
iii) No tenga ni experiencia ni certificado.
iv) Tenga certificado dado que tiene alguna experiencia anterior.

c) Determine si la experiencia y el certificado son eventos independientes.


57

7. En los datos recolectados en una encuesta sobre la satisfacción de los empleados de la empresa
Omega realizada a una muestra de 400 empleados, los resultados con las categorías desglosadas en
satisfecho y no satisfecho, y progresado y no progresado en la organización, se presentan en la
siguiente tabla de contingencia:

Satisfacción en el Avance
trabajo Progresado ( P ) No progresado ( P’ ) Total
Satisfecho ( S ) 194 162 356
No satisfecho ( S’ ) 14 30 44
Totales 208 192 400

1) Determine la probabilidad de que un empleado seleccionado aleatoriamente:


a) Esté satisfecho con su trabajo.
b) No haya progresado en la organización.
c) Está satisfecho con el trabajo o ha progresado en la organización.
d) No está satisfecho y no ha progresado
e) Está satisfecho con el trabajo dado que se sabe ha progresado en la organización.

2) ¿Estar satisfecho con el trabajo es independiente de haber progresado en la organización?.


Explique.

8. En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar
información diversa respecto al comportamiento de los consumidores. Entre las preguntas
formuladas estaba “¿disfruta comprar ropa ?”. De 240 hombres, 136 respondieron que sí. De las
260 mujeres, 44 respondieron que sí.
a) Construya una tabla de contigencia para evaluar las probabilidades.
b) Dé un ejemplo de: un evento simple, un evento conjunto.
c) ¿Cuál es el complemento de “disfruta comprar ropa”?.
d) ¿Cuál es la probabilidad que un encuestado elegido aleatoriamente:
d.1. Sea hombre?
d.2. Disfrute comprar ropa?
d.3. Sea una mujer y disfrute comprar ropa?
d.4. Sea un hombre y no disfrute comprar ropa?
d.5. Sea una mujer o no disfrute comprar ropa’
e) Suponga que el encuestado elegido es un hombre. ¿Cuál es la probabilidad que no disfrute
comprar ropa?
f) ¿Disfrutar de comprar ropa y el sexo del individuo son estadísticamente independientes?.

9. El director de una gran agencia de empleo desea estudiar las diversas características de sus
solicitantes de trabajo. Se ha seleccionado una muestra de 200 solicitantes para su análisis. Sesenta
solicitantes habían tenido sus trabajos actuales durante al menos cinco años; ochenta de los
solicitantes son graduados universitarios; 25 de los graduados universitarios duraron en sus trabajos
al menos cinco años.
a) ¿Cuál es la probabilidad que un solicitantes escogido aleatoriamente?.
a.1. Sea un graduado universitario?
a.2. Sea un graduado universitario y haya tenido su trabajo al actual menos de cinco años?.
a.3. Sea un graduado universitario o haya tenido su trabajo actual al menos de cinco años?
58

b) Dado que un empleado particular es un graduado universitario, ¿cuál es la probabilidad que


haya durado en su trabajo menos de cinco años?.
c) Determine si ser graduado universitario y haber durado en el trabajo al menos cinco años
son estadísticamente independientes.
Sugerencia: construya una tabla de contingencia.

10. Se han llevado acabo numerosos estudios intensivos de la planeación de los consumidores para
la compra de bienes duraderos como televisores, refrigeradores, lavadora, etc. En uno de estos
estudios se preguntó a 1000 individuos de una muestra aleatoriamente seleccionada si estaban
planeando comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a
las mismas personas para ver si realmente compraron una nueva T.V. la respuesta a ambas
entrevistas se tabula de manera cruzada a continuación.

Compraron ( C ) No compraron (C’) Totales


Planearon ( P ) 200 50 250
No planeando ( P’ ) 100 650 750
Totales 300 700 1000

a) Dé un ejemplo de un evento simple y de un evento conjunto.


b) ¿Cuál es el complemento de “planea comprar”?
c) si un individuo se selecciona aleatoriamente, ¿cuál es la probabilidad de que en el último
año.
c.1. Haya comprado una nueva T.V.?.
c.2. No haya planeado comprar una nueva T.V.?.
c.3. Haya planeado comprar y realmente haya comprado una nueva T.V.?.
c.4. Haya planeado comprar o realmente no haya comprado una nueva T.V.?.
d) si el entrevistado no planeo comprar una nueva T.V., ¿cuál es la probabilidad que no haya
comprado una?.
e) ¿Planear comprar una T.V. y realmente comprar una son eventos estadísticamente
independientes?. Explique.

11. Se ha emprendido una encuesta para determinar si existe una relación entre el lugar de
residencia y la propiedad de un automóvil. Se seleccionó una muestra aleatoria de 500 personas con
los resultados mostrados a continuación:

Propiedad de Área de residencia


automóvil Ciudad (C) Suburbio ( Su) Rural ( R ) Totales
Si ( S ) 90 60 25 175
No ( N ) 110 90 125 325
Totales 200 150 150 500

a) Si se selecciona aleatoriamente una persona, ¿cuál es la probabilidad que ésta.


a.1. Posea un automóvil?
a.2. Viva en suburbio?
a.3. Posea un automóvil o viva en una ciudad?.
a.4. Viva en el área rural y no posea un automóvil?
59

b) Suponga que sabemos que la persona seleccionada vive en un suburbio, ¿cuál es la


probabilidad que posea un automóvil?
c) ¿Es el área de residencia estadísticamente independiente de si la persona posea un
automóvil?. Explique.

12. Una compañía embotelladora de refrescos mantiene registros respecto al número de botellas
inaceptables obtenidas de las máquinas de llenado y coronado. Basándose en datos anteriores, la
probabilidad de que una botella proviniera de la máquina I y fuera inaceptable era de 0.01 y la
probabilidad de que una botella proviniera de la máquina II y fuera inaceptable era 0.025. la mitad
de las botellas se llena en la máquina I y la otra mitad se llena en la máquina II.

a) Si se selecciona una botella de refresco al azar, ¿cuál es la probabilidad que:


a.1. Sea una botella inaceptable?
a.2. Haya sido llenada en la máquina II?
a.3. Haya sido llenada en la máquina I y sea una botella aceptable?
a.4. Haya sido llenada en la máquina II o sea una botella inaceptable?
b) Suponga que sabemos que la botella fue llenada en la máquina I. ¿Cuál es la probabilidad
de que sea inaceptable?.
c) Suponga que sabemos que la botella es inaceptable. ¿Cuál es la probabilidad de que fue
llenada en la máquina I?
d) Explique la diferencia en las respuestas de b) y c).

13. Consideremos el caso de un distribuidor de aparatos electrodomésticos que ha estado


promoviendo cierto producto, por medio de una importante campaña publicitaria por televisión.
Para evaluar la efectividad de la campaña, se pregunta a 600 clientes que visitaron la tienda, durante
un período, si recuerdan el anuncio de la televisión se conservan los registros de las respuestas así
como de la posible compra del producto en cuestión. Los resultados de este estudio se dan en la
tabla siguiente:

Anuncio de
Televisión Recuerda ( R ) No recuerda ( R’ ) Total
Producto

Compra ( C ) 120 60 180

No compra ( C’ ) 80 340 420

Total 200 400 600

1) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que:


a. Recuerde el anuncio?
b. No recuerde al anuncio?
c. Realice una compra o recuerde el anuncio?
d. No recuerde el anuncio y realice una compra?
2) Dado el hecho de que el cliente realizó una compra, ¿cuál es la probabilidad de que haya
recordado el anuncio?.
3) Si el cliente no recuerda el anuncio, ¿cuál es la probabilidad de que realice una compra?
60

14. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que el 80% de los
estudiantes cumplen con los problemas asignados. Determinó que de los alumnos que hacen las
tareas, 90% aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 40% aprobarán.
Miguel Sánchez tomó Estadística con la profesora y tuvo calificación aprobatoria ¿cuál es la
probabilidad de que sí haya hecho las tareas?.

15. Un comprador de ropa de una gran tienda departamental compra anualmente 20% de las piezas
a un fabricante A, 30% a un segundo fabricante B y el 50% restante a diversos proveedores. De la
ropa comprada a A se vende el 80%; 75% de la de B y 90% de los restantes. ¿Cuál es la
probabilidad de que una pieza que no se vendió al final de la temporada, provenga del fabricante B?

16. Martín Pérez, gerente del departamento de crédito de Epsilon, sabe que la compañía utiliza tres
métodos para exhortar a pagar a las personas con cuentas morosas. De los datos que se tienen
registrados, él sabe que 70% de los deudores son visitados personalmente, 20% se les sugiere que
paguen vía telefónica y el restante 10% se le envía una carta. Las probabilidades de recibir alguna
cantidad de dinero debido a los pagos de una cuenta con estos tres métodos son 0.75, 0.60 y 0.65,
respectivamente. El señor Pérez acaba de recibir el pago de una de las cuentas vencidas. ¿Cuál es la
probabilidad de que la petición de pago se haya hecho:
a) Personalmente?
b) Por teléfono?
c) Por correo?

17. El gerente de comercialización de una compañía fabricante de juguete está planeando introducir
un nuevo juguete en el mercado. En el pasado, 40% de los juguetes introducidos por la compañía
han tenido éxito y 60% no lo han tenido. Antes de que se comercialice el juguete, se lleva a cabo un
estudio de mercado y se compila un informe, ya sea favorable o desfavorable. Anteriormente, 80%
de los juguetes exitosos recibieron informes favorables y 30% de los juguetes no exitosos también
recibieron informes favorables.
a) Suponga que el estudio de mercado da un informe favorable sobre el nuevo juguete. ¿Cuál
es la probabilidad de que el nuevo juguete tenga éxito?
b) ¿Qué proporción de los juguetes nuevos reciben informes favorables de estudios de
mercado?.

18. Una empresa compra cierto tipo de pieza que es suministrada por tres proveedores: el 45%de las
piezas son compradas al primer proveedor resultando defectuoso el 1%. El segundo proveedor
suministra el 30% de las piezas, y de ellas es defectuoso el 2%. Las restantes piezas provienen del
tercer proveedor, siendo defectuoso el 3% de la mismas. En un control de recepción de artículos se
selecciona una pieza al azar y es defectuosa. Calcular la probabilidad de que la haya suministrado el
segundo proveedor.
61

19. Un analista de una empresa manufacturera estima que la probabilidad de que una empresa
competidora tenga planes para comenzar a fabricar equipo nuevo en los próximos tres años es de
0.30 y de 0.70 de que la empresa no tenga tales planes. Si la empresa de la competencia sí tiene
esos planes, definitivamente se construirá una nueva instalación fabril. Si la empresa de la
competencia no tiene esos planes, existe aún una probabilidad de 60% de que se construya la nueva
instalación fabril por otras razones,
a) Al utilizar E para la decisión de participar en el campo del equipo nuevo y F para la adición de
una nueva instalación fabril, ilustre los eventos posibles mediante un diagrama de árbol.
b) Suponga que la empresa de la competencia, de hecho, ha comenzado a trabajar en la nueva
fábrica. Con esa información, ¿cuál es la probabilidad de que la empresa haya decidido ingresar
al campo del nuevo equipo?

20. Ochenta por ciento de material de vinil que se recibe del vendedor A es de calidad excepcional,
en tanto que solo cincuenta por ciento de material de vendedor B es de calidad excepcional. Sin
embargo, la capacidad de fabricación del vendedor A es limitada y, por esa razón, solo cuarenta por
ciento del vinil que la empresa adquiere proviene de este vendedor. El sesenta por ciento restante se
compra al vendedor B. Se inspecciona un embarque de vinil que acaba de llegar y se encuentre que
es de excepcional calidad. ¿Cuál es la probabilidad de que provenga del vendedor A?

21. En cierta universidad, el 70% de los estudiante vienen de instituciones privadas y el 30% de
instituciones estatales. Se sabe que el 25% de los estudiantes que vienen de instituciones privadas y
el 10% que vienen de instituciones estatales poseen vehículo propio.
a) Si se selecciona un alumno al azar de esta universidad, ¿cuál es la probabilidad de que tenga
vehículo propio?
b) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los
que vienen de instituciones estatales?
c) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los
que vienen de instituciones privadas?

22. La constructora Cedro, S.A. trata de determinar si debería presentar licitación para la
construcción de un nuevo centro comercial. En el pasado, la principal competidora de Cedro, la
constructora Nardo, S.A. ha presentado licitaciones el 70% de las veces. Si Nardo no presenta
licitación sobre un trabajo, la probabilidad de que Cedro lo obtenga es del 0.50; si Nardo presenta
licitación, la probabilidad de que lo obtenga Cedro es de o.25.
a) Si la constructora Cedro obtienen el trabajo, ¿cuál es la probabilidad de que Nardo no haya
presentado licitación?
b) ¿Cuál es la probabilidad de que la constructora Cedro obtenga el trabajo?
62

TEMA 3 : DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES


ALEATORIAS
OBJETIVOS
1. Explicar el concepto de variable aleatoria y utilizarlo para definir eventos.
2. Construir la distribución de probabilidad y la función de distribución acumulada de una
variable aleatoria discreta.
3. Calcular e interpretar la esperanza y la varianza de una variable aleatoria discreta.
4. Conocer y aplicar las propiedades de la esperanza y la varianza de una variable aleatoria
discreta.
5. Conocer los modelos probabilísticos más comunes de una variable aleatoria discreta: modelo
Binomial, Hipergeométrico y de Poisson.
6. Aplicar el modelo probabilístico más adecuado, según las condiciones experimentales, a la
resolución de problemas.

3.1 INTRODUCCION
En el tema anterior utililizabamos letras como A, B, C, para representar eventos asociados a un
experimento aleatorio y nos interesaba calcular, digamos P(A). Ahora utilizaremos
variables aleatorias como X, Y, Z, para describir los eventos asociados al mismo experimento
aleatorio, pero ahora el interés será calcular la probabilidad de que la variable aleatoria ,
digamos X, tome algún valor particular x. Por tanto, será de mucha utilidad práctica la
construción de distribuciones de probabilidad de una variable aleatoria X y la determinación
de sus características principales.
Más adelante estudiaremos algunas distribuciones clásicas de probabilidad de variables aleatorias
discretas, que llamaremos modelos probabilísticos.
Por ahora podemos iniciar con el concepto de variable aleatoria.

VARIABLE ALEATORIA
Sea S el espacio muestral asociado a un experimento aleatorio. Una función X que signa a cada uno
de los elementos w de S un número x, se llama variable aleatoria.

w x R

X (w) = x

Figura 3.1

EJEMPLO 3.1
63

Una empresa tiene 100 cuentas por cobrar de las cuales 30 tienen su saldo incorrecto. Un auditor
selecciona al azar y sin reposición 2 de dichas cuentas y luego registra el número de cuentas con
saldos incorrectos.

Definamos los eventos:


C: la cuenta tiene su saldo correcto
I: la cuenta tiene su saldo incorrecto.

S
C2 C1 C2
C1
2 C 1 I2

C2 I1 C 2
I1
I2 I1 I2

Figura 3.2

Como estamos interesados en registrar el número de cuentas que tienen su saldo incorrecto, es útil
definir una variable aleatoria X que asigne a cada elemento de S su número de cuentas con saldo
incorrecto, o bien de una manera más sencilla, que la variable aleatoria X represente el número de
cuentas con saldos incorrectos.

X
S R
C1 C2 0

C 1 I2
1

I1 C 2

I1 I2 2

Figura 3.3

Así, X ( C1 C2 ) = 0 ; X ( C1 I2 ) = 1 ; X ( I1 C2 ) = 1 ; X ( I1 I2 ) = 2

El recorrido o rango de X es RX = { 0, 1, 2 } que será llamado conjunto de valores posibles de X.


64

EJEMPLO 3.2
Registrar el tiempo que tarda un economista en revisar un documento de una empresa.

Como el resultado del experimento es ya la característica numérica que queremos registrar entonces
vamos a definir la variable aleatoria X como una función identidad que asigne a cada tiempo w
posible que tarda en revisar el documento el mismo tiempo w, esto es,

X( w ) = w

o bien de una manera más sencilla, que la variable aleatoria X represente el tiempo que tarda el
economista en revisar el documento.

VARIABLE ALEATORIA DISCRETA.


X es una variable aleatoria discreta si su conjunto de valores posibles es finito o infinito numerable,
esto es, si sus valores se pueden asociar a los enteros 1, 2, 3, . . . .

Para el ejemplo 3.1, X es una variable aleatoria discreta porque su conjunto de valores posibles es
finito.

VARIABLE ALEATORIA CONTINUA.

X es una variable aleatoria continúa si su conjunto de valores posibles es infinito no numerable, esto
es, para dos elementos cualesquiera de este conjunto siempre existirá otro entre ellos.

Para el ejemplo 3.2, X es una variable aleatoria continúa. Porque entre dos tiempos posibles
siempre existirá otro.

EVENTOS DEFINIDOS POR VARIABLES ALEATORIAS.

El conjunto de todas los elementos w de S que tienen asignado (Según X) un mismo valor particular
x, será un evento que denotaremos por X = x . Esto es,

{ w  S | X( w ) = x } es equivalente a X = x.
X
S

x R

Figura 3.4
65

De manera análoga se definen los eventos

X  x , X  x , a  X  b , X  x , X  x , a  X  b , etc.

Para el ejemplo 3.1, consideremos los siguientes eventos:

“Registra 1 cuenta con saldo incorrecto” es equivalente a { C I , I C } que también es equivalente a

X = 1

“Registrar 0 cuentas con saldos incorrectos” es equivalente a { CC } que también es equivalente a

X = 0.

“Registra al menos una cuenta con saldo incorrecto es equivalente a { C I , I C , I I } que también
es equivalente a
X  1

Para el ejemplo 3.2 consideremos los eventos:

“Tarda entre 2 y 4 horas” es equivalente a 2  X  4.

“Tarda a lo sumo 3.5 horas” es equivalente a X  3.5

VARIABLES ALEATORIAS INDEPENDIENTES

Recordemos que dos eventos A y B son independientes si

P( A | B ) = P( A )

Extendiendo esta idea, definimos que las variables aleatorias discretas X ,Y son independientes si

Para cualquier xi , yj , P( Y = yj ) | X = xi ) = P( Y = yj )

y las variables aleatorias contínuas X, Y son independientes si

Para cualquier x, y , P( Y  y ) | X  x ) = P( Y  y )

Esto es, la ocurrencia del evento X  x no afecta en nada a la ocurrencia del evento Y  y

La condición anterior también debe cumplirse para eventos expresados de cualquier otra forma.
66

3.2 DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA.

Una distribución de probabilidad de una variable aleatoria X es una función que asigna a cada valor
posible xi un número f (xi ) = P ( X = xi ) llamado la probabilidad de xi tal que:

i) f ( xi )  0
ii)  f ( xi ) = 1

Nota: Para cualquier otro valor que no sea posible


f(x) = 0
f

xi R
0 1

Figura 3.5

EJEMPLO 3.3
Recordando que X representa el número de cuentas con saldos incorrectos en el ejemplo 3.1,
construya la distribución de probabilidad de X.

Arbol de probabilidad
69/99 C2 C1 C2 0 0.4879

C1
70/100
30/99 I2 C 1 I2 1 0.2121

70/99 C2 I1 C 2 1 0.2121
30/100
I1
29/99 I2 I1 I2 2 0.0879

Figura 3.6

Como los valores posibles de X son 0, 1, 2 tendremos:

f ( 0 ) = P ( X = 0 ) = 0.4879
f ( 1 ) = P ( X = 1 ) = 0.2121 + 0.2121 = 0.4242
67

f ( 2 ) = P ( X = 2 ) = 0.0879

La distribución de probabilidad de X podemos expresarla como:

1. Una tabla
Tabla 3.1
xi f (xi )

0 0.4879
1 0.4242
2 0.0879

1.0000

2. Una función matemática

 0.4879 si x0
 0.4242 si x1

f (x)  
 0.0879 si x2
 0 si x es cualquier otro valor

3. Una gráfica.

f(x) 0.6
0.4879
0.4 0.4242

0.2
0.0879
0
-1 0 1 2 3

Figura 3.7

3.3 FUNCION DE DISTRIBUCION ACUMULADA DE UNA VARIABLE ALEATORIA


DISCRETA.
Sea f ( x ) la distribución de probabilidad de una variable aleatoria X. La función de distribución
acumulada de la variable aleatoria X se denota y define como:
68

F(x)  P(X x)  xf ( x


xi 
i ) , -  x  

EJEMPLO 3.4
Construir la función de distribución acumulada de la variable aleatoria X del ejemplo 3.1
Retomemos la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3 y observemos
que valores toma F ( x ) cuando: x  0 , 0  x  1 , 1  x  2 y x  2

i) Si x  0 , F ( x ) = 0 porque no hay valores posibles menores o iguales que x


ii) Si 0  x  1 , F ( x ) = f ( 0 ) = 0.4879 porque sólo hay un valor posible, que es el
0, cuya probabilidad es 0.4879
iii) Si 1  x  2 , F ( x ) = f ( 0 ) + f ( 1 ) = 0.4879 + 0.4242 = 0.9121
porque hay dos valores posibles, que son el 0 y el 1 cuyas, probabilidades son 0.4879 y
0.4242 respectivamente.
iv) Si x  2 , F ( x ) = f ( 0 ) + f ( 1 ) + f (2 ) = 0.4879 + 0.4242 + 0.0879 = 1
porque hay tres valores posibles, que son el 0, 1 y 2, cuyas probabilidades son 0.4879 ,
0.4242 y 0.0879 respectivamente.

Los resultados anteriores podemos expresarlos como:

1. Una función matemática

0 si x  0
 0.4879 si 0  x  1

F(x)  
 0.9121 si 1  x  2
 1 si x  2
2. Una gráfica

1
F(x) 0.9 0.9121
0.8
0.7
0.6
0.5 0.4879
0.4
0.3
0.2
0.1
0 0
-1 0 1 2 3
x
69

Figura 3.8

Algunas características de F ( x )

a) F ( x ) es siempre una función no decreciente.


b)
Lím F ( x )  1 y Lím F ( x )  0
x   x - 

c) P(a  X  b) = F(b) - F(a)

d) f ( x ) = F ( x ) - F ( x – 1 ) si x es un número natural.

EJERCICIO 3.1
Las llegadas de clientes a un almacén durante 80 días escogidos aleatoriamente se presenta en la
siguiente tabla.
Tabla 3.2
No. Llegadas No. días

0 15
1 25
2 35
3 5

80

Si X representa el número de llegadas de clientes en un día.

i) Construya la distribución de probabilidad de X


ii) ¿Cuál es la probabilidad de que cierto día lleguen menos de 3 clientes.
iii) Construya la función de distribución acumulada de X
iv) ¿Cuál es la probabilidad de que cierto día lleguen a lo sumo 2 clientes?.

3.4 ESPERANZA Y VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA.

Con el propósito de resumir la distribución de probabilidad de una variable aleatoria discreta X se


calcularán sus principales características: la esperanza y la varianza de X.

Sea f(xi ) una distribución de probabilidad de una variable aleatoria discreta X. La esperanza de X
o valor esperado de X se denota y define como:

E(X) =  xi f ( xi )
70

E ( X ) puede considerarse como una media aritmética ponderada (donde la ponderación de cada x i
sería la probabilidad f(xi)) esto es la media que espero obtener de un gran número de observaciones
independientes de X, motivo por el cual escribiremos.

E(X) = X ( la media de X )

La varianza de X se denota y define como:

V (X) = E [ (X -  X )2 ] =  ( xi -  X )2 f ( xi )

La varianza de X también se puede denotar como V( X ) =   X

El cálculo se puede simplificar utilizando la siguiente fórmula :

V (X) = E ( X2 ) - [ E ( X ) ]2 donde E ( X2 ) =  xi2 f ( xi )


La desviación estándar de X se denota y define como:

X  V(X)

EJEMPLO 3.5
Un vendedor de computadoras tiene la oportunidad de trabajar con cierto comerciante. Supongamos
que el vendedor ha evaluado las posibilidades de la venta semanal de la manera indicada abajo.
Tabla 3.3
No. Computadoras Probabilidad

0 0.1
1 0.2
2 0.3
3 0.4

i) Determine el número de computadoras que espera vender por semana. Interprete el


resultado.
ii) Determine la desviación estándar del número de computadoras que vende por semana.
Interprete el resultado.

Hagamos que la variable aleatoria X represente el número de computadoras que podría vender por
semana.

xi f( xi ) xi f( xi ) xi2 f( xi )

0 0.1 0 0
1 0.2 0.2 0.2
2 0.3 0.6 1.2
3 0.4 1.2 3.6

1.0 2.0 5.0


71

E ( X ) = 2 computadoras y V ( X ) = 5 - [ 2 ]2 = 5 - 4 = 1 computadora2

  V( X )  1  1 computadora
X

Estos resultados se interpretan así:


A medida que transcurran las semanas, el vendedor espera vender en promedio 2 computadoras y el
número de computadoras que venderá por semana variará la mayor parte de las veces entre 1 y 3
computadoras.

EJEMPLO 3.6
Para la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3

i) Calcule el número esperado de cuentas con saldos incorrectos (interprete el resultado).

ii) Calcule la varianza y la desviación estándar del número de cuentas con saldos incorrectos
(interprete el resultado)

xi f ( xi ) xi f ( x i ) ( xi -  X )2 f ( x i ) xi2 f ( xi )

0 0.4879 0 0.1756 0
1 0.4242 0.4242 0.0679 0.4242
2 0.0879 0.1758 0.1723 0.3516

1.0000 0.6000 0.4158 0.7758

i)
E ( X ) = μ X = 0.6 cuentas con saldos incorrectos.

Este resultado podemos interpretarlo diciendo que a medida que el auditor vaya
seleccionando 2 cuentas de las 100 muchas veces esperamos en promedio que 0 (ninguna) ó
1 cuenta con saldo incorrecto, pero un poco más 1 que ninguna.

ii) V ( X )  
X  0.4158    0.6448
X

Este valor representa la variación de X alrededor de  X. Esto quiere decir que el número de
cuentas con saldos incorrectos variará entre 0 (ninguna) y 1 la mayor parte de las veces que
el auditor seleccione 2 cuentas de las 100.

Utilizando la otra fórmula tendremos que:

V ( X ) = 0.7758 - [ 0.6 ]2 = 0.4158   X = 0.6448


72

EJEMPLO 3.7
Un fabricante produce cierto artículo de tal modo que el 10% son defectuosos. Si se produce un
artículo defectuoso, el fabricante pierde C$ 10, mientras que un artículo no defectuoso le produce
una ganancia de C$ 50.
Determine la ganancia esperada por artículo. Interprete el resultado.

Supongamos que X representa la ganancia por artículo y que toma los valores – 10 si se produce un
artículo defectuoso y 50 si se produce no defectuoso.

xi f ( xi ) xi f (xi )

-10 0.10 -1
50 0.90 45

44

 X = E ( X ) = C$ 44

Este resultado se interpreta así: Cuando el fabricante produzca muchos artículos espera una
ganancia promedio por artículo de C$ 44

EJERCICIO 3.2
Para la distribución de probabilidad de X del ejercicio 3.1
i) Calcule el número esperado de llegadas de clientes (interprete el resultado).
ii) Calcule la varianza y la desviación estándar del número de llegadas de clientes (interprete el
resultado).

3.4.1 PROPIEDADES DE LA ESPERANZA Y LA VARIANZA.

1) E (c ) = c ; V(c) = 0

2) E ( c X ) = c E ( X ) ; V ( c X ) = c2 V ( X )

3) E (a + b X ) = a + b E ( X ) ; V ( a + b X ) = b2 V ( X )

4) Si X , Y son variables aleatorias cualesquiera


E(X Y) = E(X)  E (Y)

5) Si X , Y son variables aleatorias independientes.


V(X Y) = V(X) + V(Y)
73

EJEMPLO 3.8
Para el ejemplo 3.5 considere las siguiente situaciones:
1) Si el comerciante le ofrece al vendedor una comisión de C$ 500 por computador vendido
determine:
i) El ingreso semanal esperado del vendedor.
ii) Las desviación estándar del ingreso semanal. Interprete los resultados.

Hagamos que la variable aleatoria Y represente al ingreso semanal del vendedor.

Entonces Y = 500X

Aplicando las propiedades de la esperanza y la varianza y recordando del ejemplo 3 que


E ( X ) = 2 computadoras y que σ X = 1 computadora tenemos que:

i) E ( Y ) = 500 E ( X ) = 500 ( 2 ) = C$ 1000

ii) V ( Y ) = 5002V ( X ) = 5002 ( 1 ) = 5002

Y  500 2  C$ 500

Por tanto a medida que transcurran las semanas, el vendedor espera tener un ingreso semanal
promedio de C$ 1000 y su ingreso semanal variará la mayor parte de las veces entre C$ 500 y C$
1500.

2) Si el comerciante le ofrece al vendedor pagarle C$ 800 fijos por semana más C$ 400 por
computador vendidor, determine:

i) El ingreso semanal promedio del vendedor.


ii) La desviación estándar del ingreso semanal
Interprete los resultados

Hagamos que Y represente el ingreso semanal del vendedor

Entonces Y = 800 + 400X

 Y = E ( Y ) = E ( 800 + 400X ) = 800 + 400 E ( X )

= 800 + 400 ( 2 ) = C$ 1600

V ( Y ) = V ( 800 + 400X ) = 4002 V ( X ) = 4002 ( 1 ) = 4002

Y 4002  C$ 400


74

¿Cómo interpretaría usted estos resultados?

EJEMPLO 3.9

Un negociante posee dos restaurantes. Sean X , Y, que se suponen independientes entre sí, las
ventas diarias de dichos restaurantes. El negociante ha reunido datos de ventas durante muchos
años, y de acuerdo con sus registros, la media y la varianza de X son de C$ 5000 y C$ 100
respectivamente y la media y la varianza de Y son de C$ 7000 y C$ 200 respectivamente.

Calcule para los dos restaurantes combinados.

i) La venta diaria promedio.

ii) La desviación estándar de las ventas diarias.

i) Sea M: La venta diaria total. Entonces M = X + Y

E(M) = E(X + Y ) = E(X) + E (Y)


= 5000 + 7000 = C$ 12000

ii) V ( M ) = V ( X + Y ) = V ( X ) + V ( Y ) = 100 + 200 = C$ 300

  300  C$ 17.3205
M
75

3.5 MODELOS PROBABILISTICOS

3.5.1 INTRODUCCION
Hay situaciones en las cuales el cumplimiento de ciertas condiciones experimentales nos lleva a
utilizar lo que llamaremos un modelo probabilístico, esto es , una distribución de
probabilidad de una variable aleatoria definida por una expresión matemática
Estos modelos tendrán un nombre y serán estudiados en esta tema.
Para poder comprender estas expresiones matemáticas necesitaremos estudiar los siguientes
conceptos:

EL FACTORIAL DE UN NUMERO
Sea n un número natural.
El factorial de n se denota y define así

n! = n ( n – 1 ) (n – 2 ) . . . . . . 1

Nota: 0! = 1

De manera que:

1! = 1
2! = 2 (1) = 2
3! = 3 (2) (1) = 6
4! = 4 (3) (2) (1) = 24

NUMERO DE COMBINACIONES DE x OBJETOS TOMADOS DE n

El número de combinaciones de x objetos tomados de n se denota y define así

 n  n!
  
x x!(n-x)!
Para las siguientes situaciones tendremos que:
76

n n n 
 1,  n ,  1
n  1 o
También podemos utilizar la siguiente fórmula simplificada

 n  n ( -1 )  ( n - x  1)
   donde (n – x + 1 ) es el último factor

 x  x!

De manera que
77

8 8! 8(7)65! 8(7)6


   56
3 !5 3(2)15! 3(2)1
Con la fórmula simplificada tendremos que

8 8(7)(6)
  56 porque 8 – 3 + 1 = 6 es el último factor

3 3(2)(1
Para situaciones como las siguientes, escribiremos sin ningún cálculo

5 10  4
   1 ,   10 ,    1
5 1  0
calculemos ahora

15 15(4)13(2)1 (0)9


  6435
7 7(6)54(3)21
3.5.2 DISTRIBUCION BINOMIAL
78

INTRODUCCION
La distribución binomial es una distribución de probabilidad de una variable aleatoria discreta, que
será aplicable cada vez que se suponga un proceso de Bernoulli.

PROCESO DE BERNOULLI
Es un proceso de muestreo, esto es, una muestra de tamaño n que resulta de repetir un mismo
experimento aleatorio  (que llamaremos ensayo) n veces y que cumple las siguientes condiciones:

1) Los resultados posibles de cada ensayo pueden clasificarse en dos eventos E y F mutuamente
excluyentes y exhaustivos que llamaremos posteriormente éxito y fracaso respectivamente.

2) Las probabilidades de (E) y (F) permanecen constantes en todos los ensayos, es decir, el
proceso es estacionario.

3) Cualquier serie de eventos E y F obtenidos de los n ensayos constituyen eventos independientes.

EL MODELO BINOMIAL
Supongamos que estamos ante un proceso de Bernoulli con n ensayos donde uno de los dos eventos
será el éxito y la probabilidad de que ocurra un éxito se representará por p.
Estaremos interesados en una variable aleatoria X que representará el número de éxitos en la
muestra, donde el objetivo principal será obtener una expresión matemática que defina a la
distribución de probabilidad de X
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución binomial con parámetros n y p , o modelo binomial con parámetros n y p.

 n x n - x
P(X x)  p (1-p) , x0,12,n
x 
donde x es un valor particular de X
y 1 – p representa la probabilidad de un fracaso.

CARACTERISTICAS.

1. Cada vez que se especifica un grupo de parámetros n y p se produce una distribución


binomial particular.
79

2. La distribución es simétrica si p = 0.50

La distribución es asimétrica a la derecha si p  0.50 y a la izquierda si p  0.50. Cuando n crece y


p se acerca a 0.50 la asimetría tiende a disminuir.

3. La esperanza de X se obtiene así

μ x  E ( X)  np

4. La varianza de X se obtiene así

V(X) = np(1–p)

EJEMPLO 3.10
En un archivo hay 5 documentos de la empresa A y 15 documentos de la empresa B. Seleccionar al
azar y con reposición 4 documentos anotando la empresa correspondiente de cada uno.

Determine la probabilidad de que 3 sean de la empresa B.

Verificando la existencia de un proceso de Bernoulli.


Aquí existe un proceso de muestreo que resulta de repetir el ensayo  : seleccionar al azar y con
reposición un documento, n = 4 veces.
Miremos ahora que condiciones cumple:

1. Cada ensayo tiene dos eventos mutuamente excluyentes y exhautivos:

A representa “es de la empresa A”


B representa “es de la empresa B”

2. Las probabilidades de A y B permanecen constantes en el proceso porque las selecciones de los


documentos se realizaron con reposición de una población finita.

3. Además cualquier serie de eventos A y B, obtenidos de los 4 ensayos, constituyen eventos


independientes.

Luego hay un proceso de Bernoulli con n = 4 ensayos.

Aplicando el modelo Binomial


Observe para el proceso anterior con n = 4 ensayos, que el evento B ( es de la empresa B) será el
éxito, y la probabilidad de que ocurra un éxito será p = P( B ) = 15 / 20 = 0.75
La variable aleatoria X representará el número de documentos de la empresa B en la muestra.
La probabilidad de que X = 3 se obtiene aplicando un modelo binomial con parámetros n = 4
y p = 0.75
80

 4 3
P(X3)  (0.75) (0.25)4(0.4219)(0.25)0.4219
 3
EJEMPLO 3.11
Debidos a las altas tasas de interés, una firma informa que 30% de sus cuentas por cobrar de otras
firmas comerciales están vencidas. Un contador escoge aleatoriamente una muestra de 5 cuentas.

1. Obtenga la expresión matemática que define a la distribución de probabilidad del número de


cuentas vencidas.

Verificando la existencia de un proceso de Bernoulli.


Aquí existe un proceso de muestreo que resulta de repetir el ensayo  : escoger aleatoriamente una
cuenta por cobrar, n = 5 veces.
Miremos ahora que condiciones cumple:

1. Cada ensayo tiene dos eventos mutuamente excluyentes y exhaustivos:

V representa “está vencida”


V’ representa “ no esta vencida”

2. Las probabilidades V y V’ permanecen constantes en el proceso porque las escogencias de las


cuentas se realizaron sin reposición de una población considerada infinita.

3. Además cualquier serie de eventos V y V’, obtenidos de los 5 ensayos, constituyen eventos
independientes.

Luego hay un proceso de Bernoulli con n = 5 ensayos.

Aplicando el modelo Binomial.


Observe para el proceso anterior con n = 5 ensayos, que el evento V será el éxito, y la probabilidad
de que ocurra un éxito será p = P( V ) = 0.30.
La variable aleatoria X representará el número de cuentas vencidas en la muestra
La expresión matemática que definirá a la distribución de probabilidad de X será la correspondiente
a un modelo binomial con parámetros n = 5 y p = 0.30.
Esto es,
81

5 x 5 - x
P(Xx) (0.3) (0.7) , x0,12,n
x
2. Determine la probabilidad de que:

a) 2 cuentas estén vencidas

5  2 3
P(X2)    (0.3 ) (0.7 )  10(0. 9)(0. 43)3  0.3 87
2
b) ninguna este vencida

5 0 5
P(X0)    (0. )3 (0. )7  (1)(1)(0.681)1  0.1681
 0
c) al menos una este vencida

P(X 1) = 1 - P(X=0)
= 1 - 0.1681 = 0.8319

d) todas esten vencidas


82

5 5 0
P(X5)    (0.3 ) ( .70)0  (1)(0. 24)(1)  0. 24
5
EJEMPLO 3.12
La probabilidad de que un presunto cliente de un centro comercial escogido aleatoriamente haga una
compra es 0.20. Un vendedor visita a 15 presuntos clientes.

1. Determine la probabilidad de que:

a) Haga menos de 3 ventas.

Puede verificarse la existencia de un proceso de Bernoulli con n = 15 ensayos, y por tanto,


aplicarse un modelo binomial
Observe que el evento V ( hacer una venta ) será el éxito y que la probabilidad de que ocurra un
éxito será p = P( V ) = 0.20
La variable aleatoria X representará el número de ventas realizadas en la muestra y

P(X3) = P(X  2) = P(X = 0) + P(X = 1) + P(X = 2)

se obtiene aplicando un modelo binomial con parámetros n = 15 y p = 0.20


83

15 0 15
P ( X  0)    ( .0 20 ) ( .080 )  ( 1 ) ( 1 ) ( .0 0352 )  0.0352
 0

15 1 14
P ( X  1)    ( .0 20 ) ( .080 )  15 ( .0 20 ) ( .0 0440 )  0.1319
 1

15 2 13
P ( X  2)    ( .0 20 ) ( .0 80 )  105 ( .0 04 ) ( .0 0550 )  0.2309
 2
Luego P ( X  3 ) = 0.0352 + 0.1319 + 0.2309 = 0.3980

b) Haga al menos 3 ventas.

P(X  3) = 1 - [P(X = 0) + P(X = 1) + P(X = 2 )]

= 1 - 0.3980 = 0.602

2. Determine el número esperado de ventas del vendedor y la desviación estándar del número de
ventas.

E ( X ) = np = 15 ( 0.20 ) = 3 ventas

V ( X ) = np ( 1 – p ) = 15 ( 0.20) ( 0.80 ) = 2.4  X  2.4  1.5492 ventas

Interpretar el resultado
84

3.5.3 DISTRIBUCION HIPERGEOMETRICA

Cuando estamos ante un proceso de muestreo con n ensayos que sólo cumple la primera condición
del proceso de Bernoulli, significa que cada elemento se seleccionó sin reposición de una
población finita de tamaño N, lo cual provocó un cambio sistemático en la probabilidad de un
éxito y un fracaso a medida que se retiraron los elementos de la población. De manera que ahora no
estaremos ante un proceso de Bernoulli, pero será de interés una variable aleatoria X que
representará el número de éxitos en la muestra.

EL MODELO HIPERGEOMETRICO
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución hipergeométrica con parámetros n, N y A, o modelo hipergeométrico con
parámetros n, N y A.

A N-A
   
n   -xx 
P(X x)  , x  0,12,,n
N
 
n 
85

donde

N representa el número de elementos en la población


A representa el número de éxitos en la población
N – A representa el número de fracasos en la población
n representa el número de elementos en la muestra
x representa el número de éxitos en la muestra
n – x representa el número de fracasos en la muestra

CARACTERISTICAS.
A
Hagamos que p  represente la proporción de éxitos en la población y que 1 – p representa
N
la proporción de fracasos en la población.

1. Cada vez que se especifica un grupo de parámetros n, N, A se produce una distribución


hipergeométrica particular.

2. La distribución es simétrica si p = 0.50 y asimétrica cuando P  0.50


La distribución es asimétrica a la derecha si p  0.50 y a la izquierda si p  0.50.
Cuando n crece y p se acerca a 0.50 la asimetría tiende a disminuir.

3. La esperanza de X se obtiene así


x  E (X)  np

4. La varianza de X se obtiene así

 N -n 
V(X)  np( 1 - p )  
 N - 1 

Lo cuál implica que  X  V(x)

EJEMPLO 3.12
Un gerente selecciona aleatoriamente 3 individuos de un grupo de 10 empleados para asignarlos a
un estudio de clasificación de salarios. Suponga que 4 de los empleados trabajaron previamente en
proyectos semejantes.

1. Determine la expresión matemática que define a la distribución de probabilidad del número de


empleados con experiencia.

Este es un proceso con n = 3 ensayos, que sólo cumple la primera condición de un proceso de
Bernoulli porque los 3 empleados se seleccionaron al azar sin reposición de una población finita
de tamaño N = 10.
86

Observe que el evento E (con experiencia) será el éxito y que por tanto tendremos que:

N representa el número de empleados del grupo.


A representa el número de empleados con experiencia.
N – A repreenta el número de empleados sin experiencia.
n representa el número de empleados en la muesta.
x representa el número de empleados con experiencia en la muestra.
n – x representa el número de empleados sin experiencia en la muestras.

La variable aleatoria X representará el número de empleados con experiencia, y la expresión


matemática que va a definir a la distribución de probabilidad de X, será la correspondiente a un
modelo hipergeométrico con parámetros n = 3, N = 10 y A = 4.
Esto es,

 4  6 
   
x  3-x
P(X  x)  , x  0,12,3
10
 
3 
87

2. Determine la probabilidad de que:

a) dos tengan experiencia.


88

 4 6   4 6
  
3 -22  21 6()
P(X2)   0.3
10 10 120
   
3  3
89

b) ninguno tenga experiencia.


90

 4 6   4 6
  
3 -00  0 3 (1)20
P(X0)   0.167
 10   1 0  12 0
   
3  3
91

c) a lo sumo 2 tienen experiencia

P(X  2) = P(X = 0) + P(X = 1) + P(X = 2)

  64 
   
 1   2  4 ( 15 )
P(X  1)    0.50
10 120
 
3 
Luego P ( X  2 ) = 0.1667 + 0.5000 + 0.3000 = 0.9667

3. Determine el número esperado de empleados con experiencia y la desviación estándar del


número de empleados con experiencia.

A 4
Como p =   0.4
N 10

E( X ) = np = 3(0.4) = 1.20 empleados

 N-n
V( X ) = np (1 – p)   = 3(0.4)(0.6)( 7 / 9 ) = 0.56   X  0.56  0.7483 empleados
 N -1 
92

LA DISTRIBUCION BINOMIAL COMO UNA APROXIMACION A LA DISTRIBUCION


HIPERGEOMETRICA.
Cuando el tamaño N de la población se considera muy grande en comparación al tamaño n de la
muestra, el hecho de que el muestreo se efectúe sin reposición tiene poco efecto en la probabilidad
de éxito de cada ensayo.
Un método empírico conveniente es que se puede utilizar una distribución binomial con parámetros
A
n y p  como una aproximación de la distribución hipergeométrica cuando n  0.05 N,
N
esto es, el tamaño de la muestra debe ser menor que el 5% del tamaño de la población.

EJEMPLO 3.13
Un producto industrial particular se envía en lotes de 200. Como la prueba para determinar si un
artículo está defectuoso es costosa, diseñó un plan de muestreo que recomienda muestrear 5
artículos de cada lote y rechazar el mismo si resulta más de un artículo defectuoso. Si se rechaza
se prueba cada artículo del lote. Suponga que un lote contiene 8 artículos defectuosos.

1. ¿Cuál es la probabilidad de aceptar el lote?

Aquí hay un proceso de muestreo con n = 5 ensayos que sólo cumple la primera condición de un
proceso de Bernoulli porque el muestreo se hace sin reposición de una población finita.

Observe que el evento D (sale defectuoso) es el éxito y que por tanto tendremos que:
N : representa el número de artículos del lote.
A : representa el número de artículos defectuosos en el lote.
n : representa el número de artículos en la muestra.
x : representa el número de artículos defectuosos en la muestra.

Como la variable aleatoria X representa el número de artículos defectuosos en la muestra


Entonces la distribución de probabilidad de X será la distribución hipergeométrica con n = 5 ,
N = 200 y A = 8.

P (aceptar el lote) = P ( X  1 ) = P ( X = 0 ) + P(X = 1)

Miremos ahora la posibilidad de utilizar la distribución binomial como una aproximación de


la hipergeométrica.

n 5
  0.025  n  0.025 N
N 200

Esto es, el tamaño de la muestra es el 2.5% del tamaño de la población. Luego se cumple la relación
empírica de que n  0.05 N. Podemos utilizar una distribución binomial con parámetros n = 5
A 8
y p   0.04 como una aproximación de la distribución hipergeométrica con
N 200
parámetros n = 5, N = 200 y A = 8.
93

5 0 5
P ( X  0 )     0.04  (0.96)  (1) (1) ( 0.8154 )  0.81.54
0

 5 1 4
P ( X  1 )     0.04  (0.96)  5 ( 0.04 ) ( 0.8493 )  0.1699
1 

P ( X  1 )  0.8154  0.1699  0.9853


3.5.4 DISTRIBUCION DE POISSON
Ahora estudiaremos un proceso semejante al proceso de Bernoulli en el cual los eventos ocurrirán en
una porción muy pequeña que generalmente será de tiempo.

PROCESO DE POISSON.

Consideremos una unidad t de tiempo, longitud, superficie, volumen, etc. dividida en porciones t
muy pequeñas. Un proceso de muestreo resultante de la posible repetición de un mismo
experimento aleatorio  ( que llamaremos ensayo y cuyos resultados posibles serán llamados
observaciones en la porción t ) será un proceso de Poisson si cumple las siguientes condiciones:

1) Las observaciones en cada porción t pueden clasificarse en dos eventos E y F mutuamente


excluyentes y exhaustivos que llamaremos éxito y fracaso respectivamente.

2) La probabilidad de que se produzca un éxito ( E ) es muy pequeño y permanece constante en


cada porción t. La probabilidad de que se produzan dos o más éxitos en una porción t es tan
reducida que podemos asignarle un valor cero.

3) La ocurrencia de un éxito ( E ) en la porción t es independiente dela ocurrencia de otro éxito


( E ) en cualquier otra porción t.

EL MODELO DE POISSON
En un proceso de Poisson estaremos interesados en una variable aleatoria X que representará el
número de éxitos en la unidad de tiempo, superficie, volumen, etc. Supongamos que  (lambda)
94

representa el número promedio de éxitos en la unidad de tiempo, superficie, volumen, etc, y que este
valor se conoce por experiencia.
Entonces la distribución de probabilidad de X definida por la siguiente expresión matemática, será
la distribución de Poisson con parámetros  , o simplemente el modelo de Poisson con parámetro .

 x e- 
P( X  x )  , x = 0, 1, 2, 
x!
e = 2.71828 

CARACTERISTICAS.

Cada vez que se especifica el parámetro  se produce una distribuciónde Poisson particular.

La distribución es siempre asimétrica a la derecha cuando  es pequeña y se acercará a la simetría


(con su punto más alto en el centro) según aumenta .

La esperanza de X se obtiene así

μ X  E(X)  λ

La varianza de X se obtiene así V(X) =   σx  λ

EJEMPLO 3.14
Suponga que el número promedio de vehículos que llegan a un parqueo es de 10 por hora.
¿ Cuál es la probabilidad de qué en una hora determinada lleguen 4 vehículos ?

Verificando la existencia de un proceso de Poisson.


Consideremos la unidad de tiempo, una hora, dividida en porciones muy pequeñas de tiempo,
digamos en segundos.

1) En cada segundo pueden observarse dos eventos mutuamente excluyentes y exhaustivos:

E : llega un vehículo.
F : no llega ninguno vehículo. Suponga que E es el éxito y F el fracaso.

2) La probabilidad de que llegue un vehículo en un segundo es muy pequeña y permanecerá


constante en cada segundo. Además la probabilidad de que lleguen 2 o más vehículos en un
segundo es casi cero.

3) La llegada de un vehículo en un segundo es independiente de la llegada de otro vehículo en


cualquier otro segundo.

Por lo tanto estamos ante un proceso de Poisson.


95

Aplicando el modelo de Poisson.


En el proceso anterior tendremos que:
X que representará el número de vehículos que llegan en una hora.
 representará el número promedio de vehículos que llegan en una hora.
Sabemos por experiencia que  = 10 y que la probabilidad de que X = 4 se va a obtener aplicando
un modelo de Poisson con parámetro  = 10

10
104 e 10000(0.00004540) 0.4540
P( X  4 )     0.0189
4! 24 24

EJEMPLO 3.15
Suponga que el número promedio de llamadas que llegan a una Central Telefónica es de 120 por
hora.
1) Construya la expresión matemática que define a la distribución de probabilidad del número de
llamadas que ocurren en 3 minutos.

Podemos verificar la existencia de un proceso de Poisson.


En este proceso tendremos que:
X representará el número de llamadas que ocurren en 3 minutos.
 representará el número promediode llamadas que ocurren en 3 minutos.

Entonces la expresión matemática que va a definir a la distribución de probabilidad de X, será la


120
correspondiente a un modelo de Poisson con parámetro   ( ) ( 3 )  2(3)  6
60
Esto es,
6x e- 6
P(X  x)  , x  0, 1, 2, 
x!

2) ¿Cuál es la probabilidad de que:

i) Se reciban 2 llamadas
62 e- 6
P(X  2)   18 e- 6  18 ( 0.0025 )  0.0450
2!

ii) Se reciba una llamada o más

P(X  1) = 1 - P(X = 0)

60 e - 6 ( 1 ) e- 6
P(X  0)    e- 6  0.0025
0! 1

P ( X  1 ) = 1 - 0.0025 = 0.9975

EJEMPLO 3.16
96

En una fábrica han ocurrido accidentes a razón de una cada dos meses. Suponga que ocurrieron en
forma independiente.

1. Determine la probabilidad de que:


i) No haya accidente en determinado mes.

Tenemos un proceso de Poisson en el cual.


X representará el número de accidentes que ocurren cada mes.
 representara el número promedio de accidentes por mes.

1
Entonces vamos a utilizar un modelo de Poisson con  = = 0.50 accidentes por mes
2
(0.5)0 e  0.5 (1)e 0.5
P( X  0 )    e  0.5  0.6065
0! 1

ii) hayan 4 accidentes en determinado trimestre


1
Utilizaremos un modelo de Poisson con  = (3)  1.5 accidentes
2
( 1.5 )4 e- 1.5 5.0625 ( 0.231 )
P(X  4)    0.0471
4! 24

2. ¿Cuantos accidentes espero en un año?

1
 = ( 12 ) = 6 accidentes
2

LA DISTRIBUCION DE POISSON COMO UNA APROXIMACION DE LA


DISTRIBUCION BINOMIAL
Cuando en una distribución binomial n es grande y p es pequeño, los cálculos son bastante
tediosos. Afortunadamente podemos utilizar el modelo de Poisson como una aproximación del
modelo binomial haciendo  = np. Una regla empírica conveniente es que tal aproximación se
puede hacer cuando n  20 y p  0.05.

EJEMPLO 16.
Se sabe que el 1% de las cuentas de ahorro de un banco están desactivadas. Se selecciona
aleatoriamente una muestra de 30 cuentas.
¿Cuál es la probabilidad de que 3 cuentas esten desactivadas?

Podríamos utilizar una distribución binomial con n = 30 y p = 0.01, pero como se cumple la
regla empírica podemos usar la distribución de Poisson con  = 30 ( 0.01 ) = 0.30

3 - 0.3
( 0.30 ) e 0.027 (0.7408 )
P(X  3)    0.0033
3! 6

Si hubieramos utilizado la distribución binomial con n = 30 y p = 0.01 tendriamos que


97

30 3 27
P(X 3)  (0. 1) (0.9 ) 406 (0. 0 1)(0.7623)0. 31
3 
De esta manera la diferencia entre la aproximación de Poisson y el valor de probabilidad binomial
real es 0.0002.

EJERCICIOS PROPUESTOS DEL TEMA 3: DISTRIBUCIONES DE PROBABILIDAD DE


VARIABLES ALEATORIAS DISCRETAS.

1. En la siguiente tabla se muestra el número de camionetas que se han solicitado por día a, una
agencia que renta vehículos, en un período de 50 días.

No. Camionetas No. días

3 10
4 16
5 18
6 4
7 2

50

Si X representa el número de camionetas solicitadas por día.

i) Construya la distribución de probabilidad de X y grafiquela.


ii) ¿Cuál es la probabilidad de que cierto día se solicitan entre 4 y 6 camionetas (incluyendo a 4
y 6)
iii) ¿Cuántas camionetas espero que sean solicitadas en un día?
iv) ¿ Calcule la desviación estándar de X e interprete el resultado

2. En la siguiente tabla se muestra el número de camiones disponibles por centro de 20 centros


distribuidores de cierto artículo

No. Camiones No. centros

1 5
2 8
3 6
98

4 1

20

1) Si X representa el número de camiones disponibles por centro.

i) Construya la distribución de probabilidad de X.


ii) Construya la función de distribución acumulada de X.

2) Suponga que un supervisor selecciona al azar el centro que visitará


i) ¿Cuál es la probabilidad de que tenga más de 2 camiones disponibles?
ii) ¿Cuántos camiones disponibles espera encontrar en el centro después de muchas visitas?
iii) Determine la desviación estándar del número de camiones disponibles por centro.
Interprete el resultado.

3. El número de revistas vendidas por día en una tienda durante 30 días se presenta en la siguiente
tabla.

No. Revistas No. días

10 3
11 7
12 10
13 8
14 2

30
Si X representa el número de revistas vendidas por día.

i) Construya la distribución de probabilidad de X y grafíquela.


ii) ¿Cuál es la probabilidad de que cierto día se vendan como máximo 12 revistas.
iii) ¿Cuántas revistas espero vender en un día ? Interprete el resultado.
iv) Calcule la desviación estándar de X e interprete el resultado.

4. Julio Martínez recibe un lote de 100 discos de clutch.


El historial de la empresa muestra que el 10% de discos recibidos es defectuoso.
Saquemos al azar 2 discos uno a uno de dicho lote (sin reposición) y anotemos el número de discos
defectuosos. Si la variable aleatoria T representa el número de discos defectuosos en la muestra.

a) Construya una distribución de probabilidad de T.


b) Determine la esperanza y varianza de T. Interprete el resultado.

5. Un inversionista ha decidido invertir su dinero en tres acciones diferentes. En su búsqueda ha


encontrado que tiene como alternativas, cinco acciones, de las cuales 2 son preferentes y 3 son
ordinarias. Si la variable aleatoria X representa el número de acciones preferentes que comprará y
decide seleccionarlas al azar.
99

a) Construya la distribución de probabilidad de X y grafíquela.

b) Elabore la función de distribución acumulada y grafiquela.

6. Supongamos que la probabilidad de éxito de un proyecto es 0.90 y que dicho proyecto es


repetido (independientemente uno de otro) hasta que el proyecto sea todo un éxito o bien haya
sufrido 3 fracasos consecutivos.
Si representamos por X el número de veces que es necesario repetir el proyecto.

a) Construya una distribución de probabilidad de X.


b) Construya una función de distribución acumulada de X.
c) Cual es la probabilidad de que el proyecto sea repetido a lo sumo 2 veces.

7. Una empresa tiene 4 cuenta por pagar de las cuales una tiene un saldo mayor que C$ 10,000.
Un contador selecciona al azar una cuenta después de la otra, sin reponerla, hasta registrar inclusive
la que tiene un saldo mayor que C$ 10,000.
¿Cuántas cuentas espera seleccionar hasta registrar inclusive la que tiene un saldo mayor que C$
10,000 ? Interpretar el resultado.

8. De 12 cuentas de un archivo, 4 contienen un error de procedimiento al contabilizar los saldos de


las cuentas.
Un auditor selecciona aleatoriamente dos de estas cuentas (sin reposición). Si X representa el
número de cuentas con error de procedimiento en la muestra.

a) Construya la distribución de probabilidad de X y grafíquela.


b) Construya la función de distribución acumulada de X y gráfiquela.

9. Un vendedor ha descubierto que las probabilidades del número de ventas por día, se presentan
de la siguiente manera:

No. Ventas Probabilidad

1 0.19
2 0.45
3 0.29
4 0.07

Si el vendedor obtiene una comisión de C$ 150 por venta determine:

i) La ganancia diaria esperada del vendedor después de muchos días.


ii) La desviación estándar de la ganancia diaria. Interpretar el resultado

10. Un agente de ventas ha recibido una oferta de trabajo de una casa comercial que distribuye
cocinas eléctricas.
100

Suponga que X es la variable aleatoria que representa el número de cocinas vendidas en una semana
y que la distribución de probabilidad de esas ventas es.

x1 f ( xi )

0 0.30
1 0.35
2 0.25
3 0.10

Si la casa comercial ofrece al agente de ventas pagarle C$ 500 fijos por semana, más C$ 300 por
cada cocina que venda, determine.
a) El ingreso semanal esperado del agente de ventas después de muchas semanas.
b) La desviación estándar del ingreso semanal del agente. Interpretar el resultado.

11. Una compañía tiene una sucursal en una ciudad con ventas diarias en córdobas representada por
la variable aleatoria X y otra sucursal en otra ciudad con ventas diarias en córdobas representada por
la variable aleatoria Y. Al analizar los registros de la compañía por largos períodos anteriores, se ha
encontrado que la media y la varianza de X son C$ 4,500 y C$ 340 respectivamente, y la media y la
varianza de Y son C$ 5,500 y C$ 300 respectivamente.
Si la variable aleatoria Z representa el total de ventas diarias en ambas sucursales, determine:
a) Z
b) Z

12. Un vendedor de paraguas gana C$ 30 en días de lluvias; cuando hay días soleados (no lluvia)
pierde C$ 6. La probabilidad de que un día sea lluvioso es de 40% ¿Que ganancia espera tener por
día a largo plazo?

13. En una empresa de negocios una persona puede obtener ganancias diarias de $ 300 con una
probabilidad 0.6 o experimentar una pérdida de $ 100 con probabilidad de 0.4.
¿Qué ganancia espera tener por día a largo plazo?

14. Se tienen dos granjas para la siembra de cierto cultivo. Se calcula que en la primera granja el
cultivo en cuestión producirá una utilidad anual de $ 20,000 si tiene éxito, y una pérdida anual de $
2,000 si no lo tiene.

Se estima también que en la segunda granja el cultivo producirá una utilidad anual de $ 25,000 si
tiene éxito, y una perdida anual de $ 5,000 si no lo tiene. Si la probabilidad de éxito en cada granja
es ½.
¿En qué granja se debe sembrar el cultivo con el fin de elevar al máximo las utilidades
esperadas?
¿Como se afectaría la decisión si la probabilidad fuera ¼ en vez de ½ ?

15. Si la probabilidad de que, en un momento dado, el precio del barril de petróleo en el Mercado
Mundial se mantenga constante es 0.46; las probabilidades de que el precio aumente $ 0.50 ó $ 1.00
101

son respectivamente 0.17 y 0.23 y la probabilidad de que el precio disminuya $ 0.25 es 0.14, ¿Cuál
es el aumento esperado en el precio del barril de petróleo?

16. Suponga que el 40% de los empleados de una gran firma están a favor de la representación
sindical, y que se pide una respuesta anónima a una muestra aleatoria de 10 empleados.

1. Obtenga la expresión matemática que define la distribución de probabilidad del número de


empleados a favor de la representación sindical.

2. ¿Cuál es la probabilidad de que:


a) Ninguno este a favor de la representación Sindical.
b) Todos estén a favor de la representación Sindical.
c) Menos de la mitad estén a favor de la representación Sindical.

17. La probabilidad de que un posible cliente haga una compra cuando un vendedor se comunique
con él es 0.40. Si un vendedor selecciona aleatoriamente de un archivo 3 posibles clientes y se
comunica con ellos.

1. ¿Cuál es la probabilidad de que el vendedor haga


a) 3 ventas
b) por lo menos 2 ventas

2. ¿Cuántas ventas espero que haga el vendedor a largo plazo?


3. Calcule la desviación estándar del número de ventas.

18. La probabilidad de que un empleado elegido al azar este participando en un programa de


inversión en acciones de una compañía es 0.30. Si se eligen al azar 5 empleados.

¿Cuál es la probabilidad de que el número de participantes sea

a) Exactamente 3 empleados?
b) Menos de 3 empleados?
c) Por lo menos 4 empleados?

19. Un gerente de un banco sabe por experiencia que, en promedio, el 10% de los clientes de
préstamos fallan en sus pagos. Un día el gerente autoriza 7 préstamos.

1. ¿Cuál es la probabilidad de que:


a) Ninguno falle en sus pagos?
b) Uno falle en sus pagos?
c) Al menos dos fallen en sus pagos?
102

2. ¿Cuántos clientes espero que fallen en sus pagos después de muchas autorizaciones de ese
tipo.
3. Calcule la desviación estándar del número de clientes que fallan en sus pagos.

20. Con base en la experiencia anterior, el 15% de las facturas de una compañía que vende libros por
correo están incorrectas. Si se selecciona una muestra aleatoria de 3 facturas actuales,

1. Obtenga la expresión matemática que define la distribución de probabilidad del número de


facturas incorrectas.

2. ¿Cuál es la probabilidad de que:


a a) dos facturas estén incorrectas?
b) No más de dos facturas estén incorrectas?

21. Suponga que el 4% de todos los insectos expuestos a un insecticida en condiciones de


laboratorio pudieron sobrevivir.
1. Si se expone una muestra de 5 insectos a este insecticida, ¿Cuál es la probabilidad de que:

a) Sobrevivan los 5 insectos?


b) No sobrevivan los 5 insectos?
c) Sobreviva al menos un insecto?

2 Si se expone una muestra de 50 insectos al insecticida.

a) ¿Cuántos espero que sobrevivan?


b) Calcule la desviación estándar del número de insectos que sobrevivan

22. La probabilidad de que un vendedor de seguros efectúe la venta en su primer visita a un cliente
nuevo es de 0.25. Si el vendedor va a visitar hoy a 3 nuevos clientes,

1. ¿Cuál es la probabilidad de que efectúe una venta a


a) exactamente un cliente nuevo
b) por lo menos dos clientes nuevos.

2. ¿ A cuántos clientes espera hacerle una venta después de muchos días ?

23. Un auditor del Departamento del Impuesto sobre la Renta está seleccionando una muestra de 6
declaraciones de impuestos de personas de una profesión particular, para una posible auditoría. Si
dos o más de ellas indican deducciones “no autorizadas”, se auditará todo el grupo (población) de
100 declaraciones. ¿Cuál es la probabilidad de una auditoría más detallada si el porcentaje de
declaraciones incorrectas es:
103

a) 25 ?
b) 30 ?
c) Comente las diferencias en sus resultados dependiendo del porcentaje real de declaraciones
incorrectas.

24. El cuerpo secretarial de un importante bufete de abogados contiene 25 secretarias, 10 de las


cuales han estado con la firma más de 5 años. Si un ejecutivo selecciona al azar a 3 secretarias para
asignarlas a un asunto nuevo,
1. ¿Cuál es la probabilidad de que:
a) ninguna tenga más de 5 años de experiencia.
b) dos tengan más de 5 años de experiencia.

2. Escriba la expresión matemática que define la distribución de probabilidad del número de


secretarias con más de 5 años de experiencia.

25. Un auditor esta analizando los documentos por pagar de una empresa comercial. En este
momento hay 800 documentos firmados por esa empresa. Como el número de documentos es
relativamente elevado, el auditor decide extraer una muestra de 8 documentos e investigarlos. La
decisión de aprobar la cuenta o de seguir investigando depende del resultado de la nuestra. El
auditor decide certificar las cuentas por pagar, si a lo más uno de los 8 documentos muestreados es
erróneo, y continuar investigando si encuentra dos o más documentos erróneos.
Si en realidad hay 16 documentos erróneos.
a) ¿Cuál es la probabilidad de que el auditor certifique las cuentas?
b) ¿Cuál es la probabilidad de que decida continuar investigando?
Sugerencia: Aproxime las probabilidades con una distribución binomial.

26. Se embarcan motores eléctricos pequeños en lotes de50. Antes de que tal cargamento sea
aceptado, un inspector elige 5 motores y los inspecciona. Si ninguno de los motores probados es
defectuoso, el lote es aceptado. Si se encuentra que uno o más son defectuosos, se inspecciona el
cargamento completo. Suponiendo que en realidad hay 3 motores defectuosos en el lote.
¿Cuál es la probabilidad de que no sea necesaria una inspección completa?

27. Un representante de ventas debe visitar 6 ciudades en un viaje. Suponga que existen 10 ciudades
en el área geográfica a visitar, de las cuales 6 de ellas son mercados primarios para el producto en
cuestión, mientras que las otras 4 constituyen mercados secundarios. Si el vendedor elige en forma
aleatoria las 6 ciudades que va a visitar.

1. Determine la expresión matemática que define la distribución de probabilidad del número de


ciudades que son mercados primarios.

2. ¿Cuál es la probabilidad de que:


a) cuatro de ellas resulten ser mercados primarios?
b) todas sean mercados primarios?
104

28. En la Contraloría General de la República (CGR) hay 20 solicitudes para trabajar como auditor.
Si se aprueban 10 solicitudes, ¿cuál es la probabilidad de qué se encuentren las 5 mejores de todas
las solicitudes?

29. El número promedio de llamadas por minuto recibidas en un taller de servicio de televisión es de
1.2
1. Determine la expresión matemática que define la distribución de probabilidad del número de
llamadas recibidas por minuto

2. ¿Cuál es la probabilidad de que en un minuto dado:


a) se reciban menos de dos llamadas
b) se reciban 4 llamadas

3. ¿Cuál es la probabilidad de que en 5 minutos dados.


a) se reciban 2 llamadas
b) al menos una llamadas

28. Los empleados de una oficina del Banco Central atienden como promedio120 personas en una
hora de aglomeración. Si se sabe que como máximo estos empleados pueden atender 3 personas por
minuto, ¿Cuál es la probabilidad de que en un minuto dado:
a) no haya cola en la oficina?
b) haya cola en la oficina?
c) hayan 3 personas en la cola de la oficina?

29. Suponga que el número de defectos por yarda cuadrada de cierto tipo de tela tiene una
distribución de probabilidad de Poisson. Según la experiencia de la fábrica, el número promedio de
defectos es de 1.5. Calcular la probabilidad de que una yarda cuadrada tenga:
a) Tres defectos o menos.
b) Entre 3 y 5 defectos.

30. Una oficina policial del país Homicilandia reporta que en dicho país hay un número promedio de
2 homicidios diarios.
1. Construya la expresión matemática que define la distribución de probabilidad del número de
homicidios diarios.
2. Determine la probabilidad de que en un día determinado haya:
a) menos de 3 homicidios.
b) Al menos 2 homicidios.

31. Desde el año 1998, la clausura de bancos por problemas financieros ha ocurrido a razón de 5.7
clausuras por año, en promedio. Suponga que el número de cierres X en un determinado período de
tiempo tienen una distribución de probabilidad de Poisson.

a) Encuentre la probabilidad de que por lo menos tres bancos sean clausurados durante un año
determinado.
105

b) Encuentre la probabilidad de que ningún banco sea clausurado durante un período de 4


meses.

32. El conmutador telefónico de una empresa puede manejar un máximo de 5 llamadas por minuto.
Si la experiencia indica que recibe un promedio de 120 llamadas por hora, encuentre la probabilidad
de que en un determinado minuto el conmutador esté sobrecargado.

33. Se supone según la experiencia que el 2% de las facturas de una empresa que vende libros por
correo están incorrectas. Si se selecciona una muestra aleatoria de 20 facturas, encuentre la
probabilidad de que cuando menos una factura este incorrecta
Sugerencia: Aproxime la probabilidad con una distribución de Poisson.

34. Para el ejercicio 21 suponga que se expone una muestra de 30 insectos al insecticida.
¿Cuál es la probabilidad aproximada, según la distribución de Poisson, de que
a) sobreviva un insecto
b) no sobreviva ninguno
106

TEMA 4 : DISTRIBUCION NORMAL

OBJETIVOS.

1. Explicar la necesidad de introducir el concepto de función de densidad de probabilidad de una


variable aleatoria contínua.
2. Definir la distribución normal y explicar sus principales características.
3. Poder transformar cualquier distribución normal en distribución normal estándar.
4. Calcular probabilidades de eventos definidos por variables aleatorias que siguen una distribución
normal.
5. Aplicar la distribución normal en la solución de problemas.

4.1 INTRODUCCION

Si x1, x2,  , xk son todos los valores admisibles de una variable aleatoria discreta X entonces
cada valor xi contribuye con una cantidad f (xi) al total:
k

 f (x )  1
i

Cuando una variable aleatoria X es continua no tiene sentido hacer una suma de probabilidades en
el sentido anterior ya que su conjunto de valores posibles es no numerable.
En este caso, se generalizará el concepto de suma ( ) con el concepto de integral (  ).

Por tanto, cuando la variable aleatoria sea contínua será necesario introducir el siguiente concepto
que sustituya al de función de probabilidad de una variable aleatoria discreta.

Función de densidad de probabilidad de una variable aleatoria X continua.

Es una función f : R  R integrable, que cumple las siguientes condiciones:


i) f ( x)  0


ii) -  f (x)dx  1

La probabilidad de que X tome un valor comprendido entre a y b será la siguiente área.

b
P(a  X  b)  a f (x)d x  A

Esto es, el área que existe entre la función, el eje x y las rectas x = a y x = b.
107

f(X)

a b X

Figura 4.1

No será interés hablar de la probabilidad de que X tome un valor particular a, ya que siempre
tendremos que:
P(X = a) = 0

Por esta razón, la probabilidad de que X tome un valor comprendido en un intervalo no se verá
afectada por el hecho de que este sea abierto o cerrado en cualquiera de sus extremos:

P(a X  b) = P(a  X  b) = P(a  X  b) = P(a  X  b)


P(X  a) = P(X  a)
P(X  a) = P(X  a)

De todos los modelos probabilísticos contínuos que existen estudiaremos a continuación el más
importante según sus aplicaciones a situaciones reales.

4.2 DISTRIBUCION NORMAL

Esta distribución es considerada la más importante por las siguientes razones:


1. Numerosos fenómenos contínuos parecen seguirla o se pueden aproximar mediante ella.
2. Se puede utilizar para aproximar distribuciones de probabilidad de variables aleatorias discretas.
3. Proporciona la base para la Estadística Inferencial.

4.2.1 EL MODELO NORMAL


Decimos que una variable aleatoria continua X, tiene una distribución normal con parámetros  y
 2, lo cual denotaremos por X  N (  ,  2 ), si la función de densidad de probabilidad de X está
definida por:

2
1 x -  
1 -  

f (x)  e 2 
, -  x  
 2
e  2.71828 

CARACTERISTICAS.
108

1. Es una familia de distribuciones normales de tal forma que cada vez que se especifican los
parámetros  y  2 se identifica al correspondiente miembro de la familia, esto es, se produce
una distribución normal particular.

2. Los dos parámetros  y  2 conciden con la media (esperanza) y la varianza respectivamente de


X, esto es

E(X) = 

V( X ) =  2  X = V( X )

3. Tiene forma de campana y el valor máximo de f ( x ) ocurre en x = . También tiene puntos de


inflexión que ocurren en x =  -  y x =  + 

-  + X

Figura 4.2

4. La mediana y la moda coinciden con  , y por lo tanto, es simétrica con respecto a  , así que

1
P(X   ) = P(X   ) =
2

5. A medida que x aumenta o disminuye a partir de  , f ( x ) decrece uniformemente, de tal


forma que cuando x    , f ( x )  0. Esto significa que el eje X es asíntota de la curva
normal, en otras palabras, que a medida que x se aleja de  , en ambas direcciones, f ( x ) se
acerca cada vez más al eje X, pero nunca llega a tocarlo. Formando de esta manera colas que se
extienden indefinidamente en ambas direcciones.

6. La posición y forma de la campana dependerá respectivamente de los valores  y . Esto


quiere decir que  le dará posición a la campana, mientras que  le dará forma. Así que cuanto
menor sea , mayor área habrá concentrada alrededor de  y la curva será muy apuntada cerca
de  , y cuanto mayor sea , menor área habrá alrededor de  y más aplastada será la curva.

B
109

A C

1 2

Figura 4.3

En la figura 4.3 se dan tres funciones de densidad de probabilidad normales. Las funciones de
densidad de probabilidad A y B tienen la misma media  1 pero diferentes desviaciones estándar.
La desviación estándar de la función de densidad de probabilidad B es menor que la desviación
estándar de la función de densidad de probabilidad de A, motivo por el cual aparece más apuntada .
Por otra parte, las funciones de densidad de probabilidad A y C tienen la misma desviación estándar
 pero medias diferentes. Más aún, las funciones de densidad de probabilidad de B y C tienen
diferentes medias y también diferentes desviaciones estándar.

4.2.2 LA DISTRIBUCION NORMAL ESTANDAR

Si una variable aleatoria Z tiene una distribución normal con parámetros  Z = 0 y  Z = 1


entonces estamos en presencia de un miembro “muy honorable” de la familia, que llamaremos
distribución normal estándar. La figura 4.4 ilustra esta distribución.

Z = 1

Z = 0 Z
Figura 4.4

4.2.3 ESTANDARIZACION DE LA DISTRIBUCION NORMAL

Cada vez que apliquemos una distribución normal a una situación dada será necesario identificar un
miembro de la familia, esto es, una variable aleatoria X que tenga distribución normal con
parámetros  y  , con el fin de poder calcular las probabilidades solicitadas.
110

Lo anterior significa que cada situación o problemas tendría su propia distribución normal, lo cual
resulta muy incómodo.

Para evitar ese inconveniente convertiremos la variable aleatoria X que tiene distribución normal
con media  y desviación estándar  a otra variable aleatoria Z que tenga distribución normal
estándar, mediante la siguiente fórmula de transformación:

X - 
 Z

Esto es, las diferencias X -  expresadas en unidades de la desviación estándar.

A Z le llamaremos variable aleatoria estandarizada y su función de densidad de probabilidad estará


definida así:
1
1 - Z2
f (z)  e 2 , -  z  
 2

El procedimiento de estandarización de una distribución normal puede apreciarse con el siguiente


gráfico.

 Z = 1

 X Z = 0 Z

Figura 4.5

En símbolos lo anterior puede escribirse así:

X - 
X ~ N (  ,  )   Z ~ N ( 0 ,1)

4.2.4 LA FUNCION DE DISTRIBUCION ACUMULADA DE LA VARIABLE ALEATORIA


Z
Suponga que f ( s ) es la función de densidad de probabilidad de Z.

La función de distribución acumulada de Z se denota y define como


111

z
F(z)  P(Z z)  -  f ( s ) d s  A

Las figuras siguientes ilustran la función de distribución acumulada de Z.

0 z Z
Figura 4.6

z 0 Z

Figura 4.7

Con el propósito de no recurrir a los métodos de integración numérica se ha elaborado una tabla para
la función de distribución acumulada de Z, que nos permite leer directamente el valor de F ( z ) para
cualquier valor z.

USO DE LA TABLA
Note que la tabla consta de dos partes, una arriba, para los valores negativos de z y otra abajo para
los valores positivos de z.
Observe, para ambas partes de la tabla, que en el márgen izquierdo está el dígito unitario y una
décima de z, mientras que en el margen superior se encuentran las centésimas de z.

EJEMPLO 4.1
Encuentre P ( Z  - 1.24 )

Aplicando la definición de función de distribución acumulada de Z tenemos que:

- 1.24
P ( Z  - 1.24 )  F ( - 1.24 )   - 
f (z)dz
112

Para no calcular la integral definida anterior es que usaremos la tabla 1, que aparece en la página
111, de la siguiente manera: Bajamos sobre el márgen izquierdo o columna z, de la parte de arriba
de la tabla, hasta encontrar -1.2, luego buscamos en el margen superior el 4.
Ahora tracemos dos líneas imaginarias, una horizontal que pase por –1.2 y otra vertical que pasa
por 4. En la intersección de las líneas anteriores encontraremos el valor 0.1075.
De manera que F (-1.24 ) = 0.1075.

La ilustración gráfica del resultado anterior es

0.1075

- 1.24 0 Z

Figura 4.8

4.2.5 COMO CALCULAR PROBABILIDADE DE EVENTOS DESCRITOS POR


VARIABLES ALEATORIAS NORMALES.
Suponga que la variable aleatoria X tienen una distribución normal con parámetros  y  2.
Estamos interesados en calcular probabilidades de eventos de finidos por X. Según la forma en que
se definan estos eventos, consideraremos los siguientes casos:

Caso 1.
El evento tiene la forma X  c donde c es un valor determinado, queremos calcular P ( X  c ).
Lo primero que tenemos que hacer es estandarizar la variable aleatoria X y el valor c.

Una ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X  c )

 A 1
x - 
A  Z

c  
 c X 0 
Z
Figura 4.9

El hecho anterior permitirá que:

cμ cμ
P(X  c)  P(Z  )  F A
σ  σ 
113

c-
Esta área acumulada a la izquierda de podemos leerla directamente en la tabla

Caso 2.
El evento tiene la forma X  c donde c es un valor determinado, queremos calcular P ( X  c ). Una
ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X  c ).

 c X

Figura 4.10

Como la distribución normal es simétrica podemos escribir que:

P(X  c) = 1 - P(X  c) = A

Esto es, el área acumulada a la derecha de c es igual a 1 menos el área acumulada a la izquierda
de c. El área acumulada a la izquierda de c, esto es, P ( X  c ) se encuentra aplicando el Caso 1.

Caso 3.

El evento tiene ahora la forma a  X  b donde a y b son valores determinados, queremos


calcular P ( a  X  b ). Una ilustración gráfica sería la siguiente donde se ha sombreado el área
que representa P ( a  X  b ).

a b X

Figura 4.11

Aplicando diferencias de áreas acumuladas a la izquierda de b y a podemos escribir que:

P(aXb) = P(X b) - P(X  a) = A


114

donde P ( X  b ) y P ( X  a ) se encuentran aplicando el caso 1 a cada una.

EJEMPLO 4.2

Suponga para cierta marca y modelo de computadora, que el tiempo de operación en forma efectiva
(antes de la primera descompostura) sigue una distribución normal con una media de 350 horas y
una desviación estándar de 50 horas.

1. ¿Cuál es la probabilidad de qué una computadora de esa marca y modelo opere efectivamente:

i) menos de 300 horas

Suponga que la variable aleatoria X representa el tiempo de operación en forma efectiva de las
computadoras.

Sabemos que X  N (  = 350 ,  = 50 ) y que necesitamos calcular P ( X  300 ).

Una ilustración gráfica de la estandarización de X y 300 se da a continuación donde se ha


sombreado el área representada por P ( X  300 ).

 = 50

A = 0.1587 A = 0.1587

300  = 350 X -1 0 Z

Figura 4.12

Como el evento X  300 corresponde al Caso 1, tenemos que:

P ( X  300 )  P  Z  300 - 350


 


 P ( Z  -1 )  F ( -1 )
 50 

ii) Por lo menos 280 horas.


115

Aquí queremos calcular P ( X  280 ).

Una ilustración gráfica será la siguiente donde se ha sombreado el área representada por
P ( X  280 ).

A = 0.9192

280  = 350 X

Figura 4.13

Como el evento X  280 corresponde al caso 2, tenemos que:

P ( X  280 ) = 1 - P ( X  280 )

donde según el caso 1, P ( X  280 )  P  Z  280 - 350


 



 50 
= F ( - 1.40 ) = 0.0808

Luego P ( X  280 ) = 1 – 0.0808 = 0.9192.

iii) Entre 300 y 403 horas.

Ahora queremos calcular P ( 300  X  403 )

La ilustración gráfica de esta situación se da a continuación donde se ha sombreado el área que


representa P ( 300  X  403 ).

A = 0.6967

300  = 350 403 X

Figura 4.14
116

Como el evento 300  X  403 corresponde al caso 3, tenemos que:

P ( 300 < X < 403) = P ( X  403) - P ( X  300 )

P ( X  403 )  P  Z  403 - 350


 
donde según el caso 1, 
 
 50 

Luego P ( 300  X  403 ) = 0.8554 - 0.1587 = 0.6967

2. Suponga que un momento dado se disponen de 500 computadoras de esa marca y modelo,
¿Cuántas espero que operen en formas efectiva después de 280 horas?.

Como hay 500 computadoras espero

500 P ( X  280 ) = 500 ( 0.9192 ) = 459.6 computadoras.

3. ¿En cuántas horas estarán descompuestas el 99% de esas computadoras?

Recordemos que X representa el tiempo de operación en forma efectiva de las computadoras.


Supongamos que “a” representa el máximo tiempo en horas que tarda en descomponerse el 99% de
esas computadoras, entonces.

A = 0.99

 = 350 a X
Figura 4.15

P ( X  a ) = 0.99

Estandarizando X y a obtenemos

P  Z  a - 350
 


 P ( Z  2.33 )
 50 
El valor 2.33 se encuentra así:
Buscamos en el cuerpo de la tabla 4.1 el valor más cercano a 0.99 que debe ser 0.9901, luego trace a
partir de él una línea horizontal imaginaria hasta que toque el margen izquierdo de la tabla en 2.3 ;
después trace una línea imaginaria vertical hasta que toque el márgen superior de la tabla en 3.
117

a - 350
Ahora si las áreas acumuladas a la izquierda de y 2.33 son iguales, entonces
50

a - 350
debe cumplirse que:  2.33  a = 350 + 2.33 (50) =350 + 116.5 =
50
466.5 horas

EJEMPLO 4.3
En la rama de la construcción está establecido por la ley un salario mínimo de C$ 12 por hora para
los obreros. Si suponemos que los salarios en esta rama están distribuidos normalmente con una
media de C$ 18 por hora y una desviación estándar de C$ 3.

i) ¿Qué porcentaje de los obreros podrían iniciar un proceso de demanda por incumplimiento a la
ley?
Supongamos que la variable aleatoria X representa al salario de los obreros.
Sabemos que X  N (  = 18 ,  = 3 ).
Cuando el salario X no llega al mínimo se puede iniciar un proceso de demanda, esto es, cuando
X  12. Por tanto calcularemos P ( X  12).

Una ilustración gráfica de la estandarización de X y 12 aparece a continuación donde se ha


sombreado el área representada por P ( X < 12 ).

 =3

A = 0.0227 A = 0.0227

12  = 18 X -2 0 Z

Figura 4.16

Como el evento X  12 corresponde al caso 1, tenemos que:

P ( X  12 )  P  Z  12 - 18
 


 P ( Z  - 2 )  0.0227
 3 
El 2.27% de los obreros pueden iniciar un proceso de demanda

ii) ¿Cuál es el menor salario que perciben los obreros que representan el 10% de los mejores
remunerados?
Suponga que c representa el menor salario que perciben el 10% de los mejores remunerados.
Entonces
P ( X  c ) = 0.10
118

Como el evento X  c corresponde al caso 2.

1 - P ( X  c ) = 0.10  P ( X  c ) = 0.90

P  Z  c - 18
 
Estandarizando X obtenemos 

 P ( Z  1.28 )
 3 

c - 18
Luego  1.28  c  18  1.28 (3)  C$ 21.84
3
EJERCICIOS PROPUESTOS DEL TEMA 4: LA DISTRIBUCION NORMAL.

1. Determine el área situada bajo la curva normal estándar que se encuentra:

a) entre z = 0 y z = 0.94
b) entre z = -2.15 y z = 0
c) a la derecha de z = 0.92
d) a la derecha de z = - 0.93
e) a la izquierda de z = 0.84
f) a la izquierda de z = -0.35

2. Determine z si el área de la curva normal.

a) A la derecha de z es 0.9983
b) a la derecha de z es 0.7324
c) a la izquierda de z es 0.1314
d) a la derecha de z es 0.2981

3. Las encuestas realizadas por una corporación financiera han revelado que la vida de una cuenta
regular de ahorros abierta en uno de sus bancos tiene una distribución normal con un promedio de
26 meses y una desviación estándar de 8.2 meses.
Si un depositante abre una cuenta en un banco que es miembro de esa corporación:

a) ¿Cuál es la probabilidad de que en esa cuenta haya todavía dinero después de 30 meses?

b) ¿Cuál es la probabilidad de que la cuenta haya sido cancelada antes de un año y medio?

4. La vida de un cierto tipo de tubo fluorescente está normalmente distribuida y su media es 1500
horas con una desviación estándar de 250. La UNAN colocará 1200 de ellos en el próximo año (en
el mes de Enero). Se calcula que esos tubos trabajarán 6 horas diarias, con 105 días de inactividad
en el año. Para confeccionar el plan de piezas de repuesto del próximo año, ¿Qué cantidad de tubos
habrá que tener de reserva para que se mantengan 1200 de ellos funcionando?

5. El número de días entre la facturación y el pago de las cuentas de crédito de un almacén tiene
una distribución aproximadamente normal con una media de 18 días y desviación estándar de 4 días.
119

a) ¿Qué proporción de las cuentas serán pagadas.

a.1. entre 12 y 18 días?


a.2. en menos de 8 días?
a.3. en 12 días o más.

b) ¿En cuántos días estarán pagadas el 99.5% de las cuentas?

6. La empresa Consolidada de Conformación de Metales produce varillas de aluminio. Se conoce


que según el proceso empleado se fabrican varillas cuyas longitudes son normalmente distribuidas
con media población igual a 6.00 pulg y desviación estándar igual a 0.30 pulg. Si las
especificaciones requeridas para las longitudes son desde 5.60 pulg hasta 6.50 pulg:

a) ¿Qué proporción de las varillas son cortas?


b) La empresa afirma que a lo sumo el 5% de las varillas resultan largas. ¿Es cierta dicha
afirmación? Explique su respuesta.

7. El editor de una editorial calcula que transcurren en promedio 11 meses antes de terminar el
proceso de publicación, desde la elaboración del manuscrito hasta terminar con el libro, con una
desviación estándar de 2.4 meses. Piensa que la distribución normal describe bien los tiempos de
publicación. De 19 libros que tendrá a su cargo este año, ¿ aproximadamente cuántos finalizarán el
proceso en menos de un año ?

8. La duración de un determinado tipo de lavadora automática tiene una distribución


aproximadamente normal, con una media de 3.1 años y una desviación estándar de 1.2 años.
¿ Qué proporción del total de unidades vendidas tendrá que ser reemplazado si la garantía es de
un año.?

9. Suponga que el tiempo necesario para que germine una variedad de semillas de una planta está
normalmente distribuido con una media de 15 días y desviación estándar de 4 días.

a) ¿Qué proporción de las semillas deben germinar


a.1. antes de 19 días?
a.2. después de 23 días?
b) ¿A los cuántos días deben haber germinado tres cuartas partes de las semillas?

10. Un análisis de duración de llamadas telefónicas locales hechas desde la oficina de una empresa
muestra que el tiempo de llamadas es una variable aleatoria que tiene una distribución
aproximadamente normal con una media de 125.7 segundos y una desviación estándar de 30
segundos. ¿Qué porcentaje de estas llamadas.

a) Es mayor que 3 minutos?


b) Es cuando mucho, 2 minutos?
c) Está entre 120 y 180 segundo?
120

11. La dirección de carreteras de un estado se encuentra conque su ingreso anual por cuotas esta
normalmente distribuido con una media de 700000 dólares y una desviación de 50000. El gerente
desea saber:

a) La probabilidad de que queden cubiertos los gastos de operación del año próximo que
ascienden a 680000 dólares.
b) La probabilidad de que estos gastos queden cubiertos en los siguientes dos años (suponiendo
que el monto de ingreso de un año sea independiente del año anterior).
c) El monto del ingreso en el mejor 25% de los años.

12. En un estado hay x gasolineras cuyos ingresos son normalmente distribuidos con una media de
29000 dólares al año y una desviación estándar de 5100. Unas 189 gasolineras ganan entre 26000 y
31000 dólares al año. ¿Cuántas gasolineras hay en el estado?.

13. Supongamos que la vida útil de cierta marca de llanta de automóvil se distribuye
aproximadamente normal con media y desviación estándar iguales a 32,000 y 1000 millas
respectivamente.

a) ¿Cuál es la probabilidad de que una llanta dure al menos 30,350 millas?

b) Si una empresa ha tenido que reemplazar el 5% de las llantas vendidas, ¿Cuál fue la garantía
utilizada?

14. La demanda semanal de artículos que produce una empresa es una variable aleatoria
aproximadamente normal con una media de 20 artículos y una desviación estándar de 2 artículos.

¿Cuál es la probabilidad de que cierta semana la demanda sea:

i) Como máximo 12 artículos?


ii) Como mínimo 20 artículos?

15. Una empresa de jabonería y perfumería usa una máquina para llenar cajas con polvo facial. En
un informe del departamento de control estadístico de la calidad, se afirma que los pesos netos de las
cajas están distribuidos normalmente con una media igual a 15 onzas y desviación estándar igual a
0.8 onzas.

a) Se selecciona al azar una caja, ¿cuál es la probabilidad de que tenga un peso neto mayor de
14.5 onzas?

b) Si cierto día la máquina llena 1500 cajas, ¿cuántas cajas tendrán pesos netos menores que
14.5 onzas?

16. En un curso de Estadística el 15% de los estudiantes, los mejores, recibieron un premio y el
10%, los peores, perdieron el curso.
Suponiendo que las calificaciones del curso están distribuidas normalmente con una media de 76
y una desviación estándar de 15.
121

i) ¿Cuál fue la calificación mínima para aprobar.


ii) ¿Cuál fue la calificación mínima para ganar un premio.

17. Se estima que aproximadamente la demanda semanal de diesel en una gasolinera estará
normalmente distribuida con una media de 1000 galones y una desviación estándar de 50 galones.
La gasolinera se abastecerá de diesel una vez a la semana. ¿Cuál debe ser la capacidad de su tanque,
si suponemos que la probabilidad de que se termine el diesel en una semana es 0.01.

Tabla 1 Función de distribución acumulada de Z (Areas a la izquierda de z)


z 0 1 2 3 4 5 6 7 8 9
-3. .0013
-2.9 .0019 .0018 .0017 .0017 .0016 .0016 .0015 .0015 .0014 .0014
-2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019
-2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026
-2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036
-2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048
-2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064
-2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084
-2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110
-2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143
-2.0 .0227 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183
-1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233
-1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0300 .0294
-1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367
-1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455
-1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559
-1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681
-1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823
-1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985
-1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170
-1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379
-.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611
-.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1921 .1894 .1867
-.7 .2420 .2389 .2358 .2326 .2297 .2266 .2236 .2206 .2177 .2148
-.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451
-.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776
-.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121
-.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483
-.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859
-.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247
-.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641
122

.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8079 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9700 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9773 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3. .9987

BIBLIOGRAFIA

 Elementos básicos de Estadística Ecónomica y Empresarial


A. M. Montiel Torres
F. Rius Díaz
F. J Barón López
Prentice Hall, España, 1997

 Serie Schaum, Estadística aplicada a la Administración y a la Economía


Leonard J. Kasmier.
Mc Graw – Hill, Mexico, 1988

 Estadística Básica en Administración.


Mark L. Berenson
David M Levine
Mexico, Cuarta edición, Prentice Hall 1992

 Estadística para Administradores


Richard I. Levine
Prentice – Hall Hispanoamericana, S. A.
Mexico, segunda edición, 1988
123

 Guía de clases de Estadística I


Departamento de Matemática y Estadística.
Facultad de Ciencias Ecónomicas, UNAN
Marilú Zeledón

También podría gustarte