Está en la página 1de 120

1

ESTADISTICA I

INTRODUCCION

CONCEPTOS BASICOS

Podríamos decir que la Estadística es un método científico para tratar datos, esto la convierte en una
ciencia que estudia cómo debe emplearse la información y pretende dar una guía de acción en
situaciones prácticas que entrañan incertidumbre.
Con el fin de ver de una manera más específica la forma conque trabaja esta ciencia, introduciremos
conceptos:

POBLACIÓN
Es un conjunto de elementos de naturaleza cualquiera de los cuales estamos interesados en estudiar al
menos una característica común y observable de dichos elementos en un determinado lugar y en un
momento dado.
Observación: La población en estudio debe estar definida sin ambigüedad de manera que no de lugar
a confusiones. Los elementos consideramos que se encuentran localizados en un determinado lugar
o región geográfica y en un periodo de tiempo dado.

EJEMPLO
El conjunto de todos los estudiantes matriculados en el RUCFA en el presente año.
Elementos: estudiantes.
Características: sexo, Nºasignaturas que lleva, estatura, edad, año que lleva, turno, procedencia, etc.

VARIABLES
Utilizaremos variables como X, Y, Z, etc. para representar las características de los elementos
Existen básicamente 2 tipos de variables:
Variables cualitativas: Son las que producen respuestas categóricas. ( modalidades)
Variables cuantitativas: Son las que producen respuestas numéricas. ( valores )

Si X representa la edad entonces X es cuantitativa.


Si Y representa el sexo entonces Y es cualitativa.

Las variables cuantitativas pueden considerarse como variables discretas y variables contínuas.

Variables discretas: Son aquellas cuyos valores posibles tienen interrupción (esto es, se separan
sin haber valores intermedios) Por lo general provienen de un proceso de conteo.
Si Z representa el número de asignaturas que lleva entonces Z es discreta.

Variables contínuas: Son aquellas cuyos valores posibles no tienen interrupción. Por lo general
provienen de un proceso de medición.

Si X representa la estatura entonces X es contínua.


2
DATOS ESTADISTICOS
Los valores posibles de una característica X los denotaremos por x, mientras que los valores realmente
observados de esa característica X , los llamaremos datos y los denotaremos por x i donde el valor del
subíndice i nos indica que es la i-ésima observación de X.
Una característica cualitativa, proporcionará datos cualitativos, y una característica cuantitativa
proporcionará datos cuantitativos que pueden ser discretos o contínuos.
Como a la estadística no le interesan los elementos en sí, sino sus características, con frecuencia
usaremos el término población para referirnos a la totalidad de datos que podrían recopilarse en una
situación dada.
x1 , x2 , … , xN

PARAMETRO
Es una medida que proviene de todos los datos de la población. Los parámetros son constantes que
representan por lo general características de la población. Generalmente se representan por letras
griegas.
Por ejemplo, la media poblacional es un parámetro que se denota y define como
N

x + x 2 + ... + x N x i
μ= 1 = .

N N

Si X representa la edad entonces  representa la edad promedio

MUESTRA
Es una parte de la población que se espera sea representativa de ella.
Usaremos también el término muestra para referirnos a los datos muestrales x1 , x2 , … , xn

Población tamaño N

X
x1 muestra tamaño n
x2
. x1, x2,….xn
.
xN datos muestrales

ESTIMACION O ESTIMADO DE UN PARAMETRO


Es una medida que proviene de los datos muestrales.
Por ejemplo, diremos que x es un estimado de µ si para una muestra de tamaño n
n

x + x 2 + ... + x n x i
x= 1 = .

n n

Si X representa la edad entonces x representa la edad promedio estimada de µ.


3
MUESTREO Y CENSO
Como el fin de la Estadística es llegar a conocer un parámetro esto podemos lograrlo haciendo un:
Muestreo. Esto es, un examen sobre una parte de la población.
Censo. Esto es, un examen sobre toda la población.

¿QUE ES LA ESTADISTICA?
La Estadística estudia los métodos y procedimientos para recopilar, organizar, presentar y analizar
datos, siempre y cuando haya variabilidad e incertidumbre en ellos, lo cual ocurre en poblaciones
suficientemente grandes. También realiza inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y formulación de predicciones.

DIVISION DE LA ESTADISTICA

ESTADÍSTICA DESCRIPTIVA
Es la parte de la estadística que estudia los métodos de recopilación, organización, presentación y
análisis de un conjunto de datos.
ESTADÍSTICA INFERENCIAL
Estudia los métodos que hacen posible la estimación de un parámetro en base a datos muestrales.

EL PAPEL DE LOS PAQUETES DE COMPUTACION EN ESTADISTICA


La creciente disponibilidad de computadoras ha introducido cambios los negocios, hogares y aulas
de clase. Los especialistas en Estadística y los investigadores en diversas disciplinas pueden ahora
utilizar la computadora cuando se trabaja con base de datos grandes o con procedimientos de cálculo
muy complejos.
En los últimos años ha habido un amplio desarrollo de muchos grupos de programas estadísticos o
“paquetes estadísticos” para ser usados en computadoras tales como el SAS, SPSS, Minitab, etc.
Debido a que Office se encuentra instalado en casi todas las computadoras, una manera fácil de
tener acceso a un programa que proporciona una gran ayuda en Estadística es la utilización de las
funciones estadística de la hoja de cálculo de Excel.

POR QUE ESTUDIAR ESTADISTICA


El uso de métodos estadísticos como auxiliar para el análisis de datos y para la toma de decisiones
ha crecido en forma rápida en la última década, y continuará creciendo en el futuro. Los conceptos
y métodos que se describen en este texto proporcionan las bases fundamentales para la aplicación de
la Estadística en una amplia variedad de carreras universitarias tales como Economía,
Administración de Empresas, Contabilidad Pública y Finanzas, Mercadotecnia, Banca y Finazas,
etc.
4
TEMA 1: ESTADISTICA DESCRIPTIVA
OBJETIVOS.

1. Conocer procedimientos para organizar datos en una distribución de frecuencias.


2. Construir e interpretar tablas y gráficas estadísticas.
3. Calcular e interpretar medidas de posición, dispersión, asimetría y apuntamiento de datos.

INTRODUCCION
Este tema pretende introducir al estudiante en el manejo de datos numéricos, enseñarle a organizar y
presentar datos obtenidos de un estudio mediante la construcción de tablas y gráficas estadísticas.
También será de vital importancia poder condensar la información en medidas que la representen en
forma clara, por tal razón, trataremos de encontrar valores para esas medidas (estadísticos o
parámetros) que logren sintetizar la información. Estas medidas expresarán la posición, dispersión,
asimetría y forma de los datos.

1.1 RECOPILACIÓN DE DATOS


Según la historia del hombre la curiosidad lo ha conducido a la experimentación y la investigación,
con el objeto de ayudar al proceso de toma de decisiones.
Para el investigador la información necesaria son los datos. Para que un análisis estadístico resulte
útil en el proceso de toma de decisiones, los datos de entrada deben ser apropiados.
Con tal fin necesitamos utilizar medios que permitan recoger la información necesaria de la manera
más eficiente.
Los datos apropiados pueden ser recopilados de:
a) Datos publicados
Por fuentes gubernamentales, industriales, institucionales, particulares, etc.
b) Registros de instituciones
c) La observación.
Esto es, diseñando un experimento que nos permita obtener la información que deseamos.
c) Encuestas
Cuando a) b) y c) no son apropiados para el estudio que estamos haciendo utilizamos la encuesta,
esto es, un instrumento que nos permite recopilar la información necesaria. La encuesta está limitada
por factores: tiempo, dinero, recursos materiales y humanos disponibles.
Se puede llevar a cabo por dos formas: a) Por muestreo b) Por censo

OBTENCION DE DATOS MEDIANTE ENCUESTAS


Es importante desarrollar un instrumento que permita hacer varias preguntas y manejar diversas
variables, esto es, aplicar un cuestionario.

DISEÑO DEL CUESTIONARIO


El procedimiento general para diseñar un cuestionario implica:
i) Elegir las variables necesarias para alcanzar el objetivo de la encuesta
ii) Decidir una forma de respuesta
Existen 3 formas de hacer una encuesta: entrevista personal, telefónica y por correo.
iii) Plantear las preguntas.
Se debe presentar cada una de las preguntas en forma clara y con la menor cantidad posible de
palabras, además asegurarse que sean esenciales para la encuesta.
iv) Probar el cuestionario
Se hace una prueba piloto del cuestionario para un grupo reducido de sujetos, a fin de que se pueda
evaluar en claridad y longitud
5
Ejemplo 1.1
Suponga que se quiere hacer una encuesta por muestreo para conocer la situación socioeconómica de
las familias de un sector de Managua.

Diseñe un pequeño cuestionario que permita obtener datos apropiados para esa situación
El investigador junto con el estadístico decide que las variables que debe reflejar la encuesta son:
1. Ingreso y tamaño de las familias.
2. Estado económico de las familias.

A continuación se ilustra el cuestionario que diseñaron


1. ¿Qué tipo de trabajo tiene?
(1) Formal (2) Informal
2. ¿Cuál es el ingreso familiar mensual?
3. ¿El balance económico actual de la familia señala
(1) Ahorro (2) Deuda (3) Ninguno
4. ¿Cuántos hijos tiene?
5. La vivienda que ocupa es?
(1) Propia (2) Financiada (3) Alquilada (4) Ninguna
Para obtener las respuestas apropiadas hay situaciones donde se requieren definiciones operativas de
la variable, esto es, aclaraciones de cómo medirla y a través de que procedimiento. Una vez que se
ha seleccionado la muestra hay que enviar una carta de presentación seguida de la visita personal.
La carta de presentación debe ser breve y concreta. Debe establecer el objetivo de la encuesta, la
forma en que se van a utilizar los resultados, y por qué es importante que el encuestado participe.

Borrador de una carta de presentación


Managua 30 de Julio 2015
Estimado Sr.(a)
En nombre de la compañía consultora FUDEN le envío esta carta para solicitarle su amable
cooperación y participación en una encuesta que estamos realizando. Deseamos recolectar
información que nos permita desarrollar un perfil económico del sector que ahora estamos
atendiendo. Su hogar ha sido elegido al azar de una lista de casas en su sector.
Apreciaríamos mucho si permitiera que una persona autorizada por la compañía lo visitara durante
unos cuantos minutos en los próximos días y le proporcione la información necesaria.

Atentamente

Alejandro Jerez Montalbán, Gerente


FUDEN

1.2 ORGANIZACIÓN DE DATOS


6
Cuando el conjunto de datos recopilados es muy grande podemos resumir esta información
para facilitar su presentación y análisis posterior.
EN DATOS REPETIDOS
Aquí sólo se considera el caso en que X es una variable discreta cuyos valores se repiten
considerablemente, motivo por el cual, se organizarán según el número de veces que aparecen
registrados.
Ejemplo 1.2
Suponga que se decide aplicar el cuestionario del ejemplo 1.1 para una muestra de 30 familias de ese
sector y que los números de hijos de cada familia según la pregunta 4 fueron:

2 3 2 4 2 0 2 3 5 2
0 1 3 4 2 3 1 2 3 1
2 2 3 4 1 3 3 2 1 3 ¿Cómo podría resumir esta información?

tabla 1.1
N°hijos N°familias

0 2
1 5
2 10
3 9
4 3
5 1

EN DATOS AGRUPADOS
Aquí se considera que X es una variable contínua cuyos valores se registrarán con cierta
aproximación (cierto número de decimales) y se organizaran en lo que llamaremos clases.
Así que introduciremos primero los conceptos necesarios:

▪ Sean Li y Ls dos números que llamaremos límite inferior y límite superior respectivamente.
Un intervalo de clase o simplemente clase se define como el conjunto de todos los números mayores
que Li y menores o iguales a Ls.
Los denotaremos así

Li ---- Ls : Más de Li hasta Ls

▪ Una clase de extremo abierto es la que no especifica uno de sus límites


y la denotaremos así:

Hasta Ls
Más de Li

▪ Amplitud o tamaño de un intervalo de clase c = Ls – Li


▪ Punto medio de un intervalo de clase o marca de clase j

Li + Ls
mj = j = 1, 2, ..... , g donde g representa el número de clases
2

Ejemplo 1.3
7
Suponga que se decide aplicar el cuestionario del ejemplo 1.1 para una muestra de 30 familias de ese
sector y que los ingresos mensuales en cientos de córdobas de cada familia según la pregunta 2
fueron:
72 48 78 93 51 75 51 69 69 57
63 51 39 60 90 72 57 66 63 54
75 42 87 60 78 45 81 63 66 69

Organice los datos recopilados anteriormente en 5 clases

1. Ordenar los datos

39 42 45 48 51 51 51 54 57 57
60 60 63 63 63 66 66 69 69 69
72 72 75 75 78 78 81 87 90 93

2. Determinar el rango

R = xmayor – xmenor = Dato mayor - Dato menor R = 93 - 39 = 54

3. Determinar N clases '' g '' y tamaño de clase ''c''.


R
Si g es dado, c  pero cercano a
g
54
c> = 10.8 tomaré C = 12
5

4. Escribir las clases.


El límite inferior de la primera clase debe ser un número menor y cercano al dato menor.
El límite superior de la primera clase se obtiene sumándole a su límite inferior el tamaño de clase.
Para que haya continuidad el límite superior obtenido de la primera clase se pone como límite inferior
de la segunda clase y el superior se obtiene sumándole el tamaño de la clase. Las siguientes clases se
encuentran con el mismo procedimiento, teniendo cuidado de que el límite superior de la última clase
sea mayor (pero cercano) o igual al dato mayor.
Si tomamos tentativamente 36 como límite inferior de la primera clase, su límite superior será 36+12
=48. Ahora tomemos 48 como límite inferior de la segunda clase entonces su límite superior será
48+12=60. Obtenga las siguientes clases y compare los resultados con la siguiente tabla.

Tabla 1.2 Organización de los datos del ejemplo 1.2

N familias Ls última clase = Li primera clase + gc

36 ------- 48 4 Ls última clase = 36 + 5 (12 ) = 96


48 ------- 60 8
60 ------- 72 10
72 ------- 84 5
84 ------- 96 3

30
5. Contar los datos
1.3 PRESENTACION DE DATOS
8
Una vez organizados los datos debemos presentarlos de una forma que facilite su análisis.
1.3.1 DATOS CUANTITATIVOS
En fenómenos cuantitativos los valores de los datos pueden presentarse en tablas o gráficas.
El uso de tablas o gráficas para presentar datos harán más manejable y significativo el proceso de
análisis e interpretación de los datos.
Las tablas contendrán básicamente un título, un cuerpo y una fuente.
En las gráficas tomaremos en el eje horizontal la característica de interés X y en el eje vertical las
frecuencias.

DATOS REPETIDOS
Utilizaremos en su presentación el concepto de frecuencia con que se presenta un dato
Supongamos que fi representa la frecuencia conque se presenta el dato xi de una variable de interés X.
Podemos presentar este conjunto de datos en lo que llamaremos una distribución de frecuencias de X,
mediante una tabla o una gráfica.

TABLA DE FRECUENCIAS DE UNA VARIABLE DISCRETA


Ejemplo 1.4
Si X representa el número de hijos de cada familia, podemos presentar los datos de la tabla 1.1 del
ejemplo 1.2, con la siguiente tabla

Tabla 1.3 Distribución de frecuencias del número de hijos de 30 familias de un sector de Managua.
xi fi
N° hijos N° familias

0 2
1 5
2 10
3 9
4 3
5 1

30
Fuente: Encuesta realizada en un sector de Managua

GRAFICO DE FRECUENCIAS DE UNA VARIABLE DISCRETA


Ejemplo 1.5
Con los datos de la tabla 1.3 del ejemplo 1.4 obtenemos la siguiente figura.
12
f(X)
10
8
6
4
2
0
-1 0 1 2 3 4 5 6
X

Figura 1.1 Distribución de frecuencias del número de hijos de 30 familias de un sector de Managua.

PARA DATOS AGRUPADOS


9
Como los datos deben presentarse de una manera que facilite su análisis, su presentación utilizará el
concepto de frecuencia de clase.
Así que cuando los datos estén agrupados diremos que forman una distribución de frecuencias, la cual,
puede ser presentada por una tabla o una gráfica.
La selección de las unidades en los ejes de las gráficas se hará según la regla de los 3/4 que dice lo
siguiente:
La altura del punto correspondiente a la mayor frecuencia debe ser aproximadamente igual a los 3/4
del eje horizontal.

TABLA DE FRECUENCIAS (RELATIVAS)


Si un conjunto de datos están agrupados en g clases introduciremos los siguientes conceptos antes de
presentarlos:
Frecuencia (absoluta) de la clase j. Número de datos en la clase j
fj j = 1, 2, … , g

Frecuencia relativa de la clase j. Proporción de datos que corresponde a la clase j.

fj
frj = j = 1, 2, … , g
n

Ejemplo 1.6
Con los datos de la tabla 1.2 del ejemplo 1.3 obtenemos la siguiente tabla.

Tabla 1.4 Distribución de frecuencias de los ingresos mensuales de 30 familias de un sector de


Managua.
Niveles de fj frj
Ingreso mj N familias Prop. Familias

36 --- 48 42 4 0.13
48 --- 60 54 8 0.27
60 --- 72 66 10 0.33
72 --- 84 78 5 0.17
84 --- 96 90 3 0.10

30 1.00
Conteste las siguientes preguntas:
¿Cuántas familias tienen un ingreso mensual entre 48 y 60?
¿Qué proporción de familias tienen un ingreso mensual entre 60 y 72?

HISTOGRAMA DE FRECUENCIAS (RELATIVAS)


Ubicamos en el eje horizontal los límites inferiores y superiores de cada clase.
10
Dibujamos rectángulos tales que las longitudes de las bases correspondan a los tamaños de las clases
y las alturas sean las correspondientes frecuencias de las clases.
Ejemplo 1.7
Con datos de la tabla 1.4 del ejemplo 1.6 obtenemos la siguiente figura.
f
12

10
10

8
8

6
5
4
4
3

0
36 48 60 72 84 96
X

Figura 1.2 Histograma de frecuencias de los ingresos mensuales de 30 familias de un sector de


Managua.
POLÍGONO DE FRECUENCIAS
Se forman haciendo que cada marca de clase represente los datos de esa clase. Luego se toman las
frecuencias correspondientes a cada marca de clase para después unir los puntos resultantes con
segmentos. Algunos prolongan el polígono hasta las marcas de clase imaginarias inferior y superior
inmediato
Ejemplo 1.8
Con datos de la tabla 1.4 del ejemplo 1.6 se ha dibujado el polígono de frecuencias de los ingresos
mensuales de las 30 familias. Ver figura 1.3

12
10
frecuencia

8
6
4
2
0
30 42 54 66 78 90 102
X

Figura 1.3

TABLA DE FRECUENCIAS ACUMULADAS (RELATIVAS ACUMULADAS)


11
Si un conjunto de datos están agrupados en g clases introduciremos los siguientes conceptos antes de
presentarlos:
Frecuencia acumulada hasta la clase j. Número de datos cuyos valores son inferiores o iguales al
límite superior de la clase j.
faj = f1 + f2 + … + fj

Frecuencia relativa acumulada hasta la clase j. Proporción de datos cuyos valores son inferiores o
iguales al límite superior de la clase j
fa j
fra j = j = 1, 2, … , g
n
Ejemplo 1.9
Con los datos de la tabla 1.4 del ejemplo 1.6 obtenemos la siguiente tabla.
Tabla 1.5 Distribución de frecuencias acumuladas de los ingresos mensuales de 30 familias de un
sector de Managua.
faj fraj
Niveles de Nº familias Prop. familias
Ingreso hasta clase j hasta clase j

36 --- 48 4 0.13
48 --- 60 12 0.40
60 --- 72 22 0.73
72 --- 84 27 0.90
84 --- 96 30 1.00

30 1.00
Conteste las siguientes preguntas:
¿Cuántas familias tienen un ingreso mensual inferior a o igual 84?
¿Qué proporción de familias tienen un ingreso mensual inferior o igual a 72

POLÍGONO DE FRECUENCIAS ACUMULADAS (RELATIVAS ACUMULADAS)


Ubicamos en el eje horizontal los límites superiores de todas las clases. Algunos prolongan el
polígono hasta el límite superior imaginario de la clase imaginaria inferior inmediata
Ejemplo 1.10
Con datos de la tabla 1.5 del ejemplo 1.9 obtenemos la siguiente figura.

fa 40
30
20
10
0
36 48 60 72 84 96
X

Figura 1.4 Polígono de frecuencias acumuladas de los ingresos mensuales de 30 familias de


un sector de Managua.

DATOS RELACIONADOS CON EL TIEMPO


12

Ejemplo 1.11

Tabla 1.6 Costo de la canasta básica en córdobas a nivel nacional durante el período 1998 – 2007.

Años 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007

Costo 1200 1248 1312 1408 1760 1920 2160 2480 2560 2720

Fuente. Banco Central de Nicaragua.

GRAFICO DE LINEAS
Consiste en un conjunto de líneas o segmentos de recta que muestran los cambios que experimenta
una determinada variable, generalmente en función del tiempo. Las coordenadas se pueden graficar
en el centro del período de tiempo.

Con los datos de la tabla 1.6 del ejemplo 1.11 obtenemos la siguiente figura.

2900
2800
2700
2600
2500
2400
2300
2200
2100
2000
Costos

1900
1800
1700
1600
1500
1400
1300
1200
1100
1000
900
800
700
600
500
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007

Años

Figura 1.5 Gráfico de líneas del costo de la canasta básica en córdobas a nivel nacional durante el
período 1998 – 2007.

Observe que el costo de la canasta básica siempre crece durante el período 1998 – 2007, ocurriendo
un crecimiento a un ritmo mayor a partir de 2002.

COMPARACION DE GRAFICOS LINEALES


Estos gráficos generalmente se utilizan para comparar aspectos contrapuestos tales como ingresos –
gastos, exportación – importación, etc.
13
Ejemplo 1.12

Tabla 1.7 Salario mínimo del sector industrial a nivel nacional para el período 1998 – 2007.

Años 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007

Salarios 640 800 960 1120 1280 1360 1440 1520 1600 1680

Fuente: Banco Central de Nicaragua.

Con los datos de la tabla 1.6 y 1.7 de los ejemplos 1.11 y 1.12 respectivamente obtenemos la
siguiente figura.

2900
2800
2700
2600
2500
2400
2300
2200
2100
2000
Costos

1900
1800
1700
1600
1500
1400
1300
1200
1100
1000
900
800
700
600
500
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007

Años

Costo Salarios

Figura 1.6 Comparación del costo de la canasta básica y el salario mínimo del sector industrial para
el período 1998 – 2007.
Observe que el costo de la canasta básica siempre es mayor que el salario mínimo, ocurriendo la
diferencia más pequeña de C$ 288 en el año 2001.
De 1998 al 2001 el salario creció a un ritmo mayor que el costo de la canasta básica, pero del 2002
al 2007 el costo de la canasta básica creció a un ritmo mucho mayor que el salario.
De la figura anterior podemos comentar que el aparato industrial nicaragüense tiene poco desarrollo.

1.3.2 DATOS CUALITATIVOS


En los fenómenos cualitativos, las respuestas categóricas se pueden clasificar en tablas o gráficas.
14
Ejemplo 1.13
Suponga que se decide aplicar el cuestionario del ejemplo 1.1 para una muestra de 30 familias de ese
sector, obteniendo de la pregunta 5 los siguientes resultados.

Tabla 1.8 Número de familias según el estado de ocupación de su vivienda.

ESTADO DE OCUPACION N°familias % ANGULO

Propia 10 33.33 120°


Financiada 4 13.33 48°
Alquilada 14 46.67 168°
Ninguno 2 6.67 24°

Total 30 100.00 360°

Fuente: Encuesta realizada en un sector de Managua

GRAFICA DE PASTEL O SECTORES


Se construyen en base a un círculo que representa el total de las distintas categorías en que se divide
el fenómeno cualitativo, particionando este círculo en tantos sectores circulares como categorías tenga
la variable cualitativa. La magnitud del ángulo de los sectores se calcula con la siguiente fórmula:

Valor de la categoría
Angulo del sector = x 360°
Valor total de las categorías

Con los datos de la tabla 1.8 del ejemplo 1.13 obtenemos la siguiente figura.

10, 33% ALQUILADA


14, 47% FINANCIADA
NINGUNO
2, 7% PROPIA
4, 13%

Figura 1.7 Gráfica de pastel que ilustra el porcentaje de familias según el estado de ocupación de
su vivienda.

GRAFICA DE BARRAS
Este gráfico está constituido por un conjunto de barras o rectángulos, separados por distancias iguales
cuyas alturas son el valor de los datos correspondientes a las categorías que señalan sus bases.
Con los datos de la tabla 1.8 del ejemplo 1.13 obtenemos la siguiente figura.
15

14
15
10

N°familias
10

4
5 2

0
ALQUILADA FINANCIADA NINGUNO PROPIA
Estado de ocupación

Figura 1.8 Gráfica de barras que ilustra el número de familias según el estado de ocupación de su
vivienda.
Ejemplo 1.14 Suponga que se decide aplicar el cuestionario del ejemplo 1.1 para una muestra de 30
familias de ese sector, obteniendo de las preguntas 3 y 5 los siguientes resultados.

Tabla 1.9 Número de familias según el balance económico y el estado de ocupación de su vivienda.

EST OCUP
Total
BALANCE ALQUILADA FINANCIADA NINGUNO PROPIA general
AHORRO 1 4 5
DEUDA 4 4 1 2 11
NINGUNO 9 1 4 14
Total general 14 4 2 10 30

10 9

8 ALQUILADA
6 FINANCIADA
4 44 4
4 NINGUNO
2
2 1 1 1 PROPIA

0
AHORRO DEUDA NINGUNO

Figura 1.9 Gráfica de barras que ilustra el número de familias según el balance económico y el estado
de ocupación de su vivienda.
Observando el gráfico anterior conteste las siguientes preguntas:
¿Cuántas familias cuyo balance económico señala ahorro tienen casa propia?
¿En qué balance económico hay mayor cantidad de familias alquilando vivienda?
1.4 ANALISIS DE LOS DATOS
Aquí el investigador trata de resumir la información disponible en algunas expresiones, esto es,
valores o medidas que nos fijen el comportamiento global del fenómeno.
El análisis de los datos consiste básicamente en la determinación de dos medidas que representan
características de los datos.
16

• Medidas de posición
Nos indican las posiciones o lugares alrededor de los cuales se distribuyen los datos.

• Medidas de dispersión
Nos informan sobre la variabilidad de los datos alrededor de las medidas de posición.

Existen otras medidas que serán estudiadas posteriormente.

Posición Posición

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
x

Figura 1.10 Puntos sobre la recta real correspondientes a dos conjuntos de datos.

¿Cómo se dispersan los datos y alrededor de qué posición lo hacen ?

El cálculo de estas medidas dependerá de la presentación que tengan los datos, esto es, si están
agrupados o no agrupados. Con los datos agrupados se aproximan fácilmente las principales
características de los datos y de esta manera se compensa el hecho de que, al ser agrupados, se
pierde información inicial referente a las observaciones individuales.

1.4.1 MEDIDAS DE POSICION

1.4.1.1 MEDIDAS DE POSICIÓN CENTRAL


Son valores representativos que tienden a situarse en el centro de un conjunto de datos ordenados
según su magnitud.

LA MEDIA ARITMÉTICA

DATOS NO AGRUPADOS EN CLASES


Si x1, x2,..........,xn representan datos muestrales entonces su media muestral se denota y define así

x i
x= .

Si x1, x2,..........,xN representan todos los datos poblacionales entonces su media poblacional se
denota y define así
17
N

x i
μ= .

Ejemplo 1.15
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.

20, 10, 15, 25, 20

Calcule el saldo promedio de las 5 cuentas

Elementos: cuentas
X: saldo
n=5

20 + 10 + 15 + 25 + 20 90
x= = = 18 ( miles de C$ )
5 5

Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X utilizaremos para la media
muestral la siguiente fórmula:

x f i i
x= .

Ejemplo 1.16
Dada la distribución de frecuencias de la tabla 1.1 del ejemplo 1.2, calcule el número promedio de
hijos de las familias.

Tabla 1.10
xi fi xifi

0 2 0
1 5 5
69
2 10 20 x= = 2.3 hijos
3 9 27 30
4 3 12
5 1 5

30 69

DATOS AGRUPADOS EN CLASES


18
Si los datos representados por la variable de interés X están agrupados en “g “clases consideraremos
que los valores de X serán las marcas de clase, motivo por el cual escribiremos:
Para una muestra:
g

m f j j
x= .
mj: marca de la clase j
n
fj: frecuencia de la clase j

Para una población:


g

m f j j
μ= .

Ejemplo 1.17
Para la distribución de frecuencias de los ingresos mensuales en cientos de córdobas de 30 familias
de un sector de Managua presentada por la tabla 1.4 del ejemplo 1.6, calcule el ingreso mensual
promedio de las familias.

Tabla 1.11
fj
Ingresos mj No. familias mjfj

36 ---- 48 42 4 168
48 ---- 60 54 8 432
60 ---- 72 66 10 660
72 ---- 84 78 5 390
84 ---- 96 90 3 270

30 1920

1920
x= = 64 cientos de córdobas
30

PROPIEDADES DE LA MEDIA ARITMÉTICA

i. Todo conjunto de datos tiene una media y es única.


ii. La suma algebraica de las desviaciones de un conjunto de datos con respecto a su media es
cero.
n

 (x.
i − x) = 0
19
Ejemplo 1.18
Comprobación de que la suma algebraica de las desviaciones de los números 1, 3, 5, 7 con respecto
a su media es cero.
Tabla 1.12

xi xi - 4 x

1 -3
3 -1
5 1
0 1 2 3 4 5 6 7 8
7 3
X
16 0

16
x= =4 Figura 1.11
4

DESVENTAJAS DE LA MEDIA ARITMÉTICA


i. Es muy sensible a las observaciones extremas cuando éstas no están equilibradas en ambos lados.
ii. Es inadecuada si hay clases de extremo abierto.

LA MEDIANA
Para datos que contienen valores extremos es recomendable utilizar la mediana porque ésta no es
sensible a las observaciones extremas.
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos.

DATOS NO AGRUPADOS EN CLASES

Si un conjunto de datos están ordenados según su magnitud en orden creciente o decreciente entonces
la mediana la determinamos así:

i. Si n es impar entonces la mediana es el valor central

n +1
El valor correspondiente a la posición:
2

ii. Si n es par la mediana es el promedio de los dos valores centrales

n n
El promedio de los valores correspondiente a las posiciones: y +1
2 2
20
Ejemplo 1.19
Consideremos el costo en córdobas de la canasta básica de 5 ciudades:

2080, 1600, 1760, 2160, 1920


Determine la mediana.

El arreglo ordenado es: 1600, 1760, 1920, 2080, 2160

Me = 1920 Posición: 3

Ejemplo 1.20

En 10 días un Banco tuvo 18, 13, 15, 12, 8, 3, 7, 14, 16 y 3 transacciones en moneda extranjera.
Determine la mediana.

El arreglo ordenado es: 3, 3, 7, 8, 12, 13, 14, 15, 16, 18


Posiciones: 5 y 6
12 + 13
Me = = 12.5
2

NOTA: La mediana siempre existe y es única.

DATOS AGRUPADOS EN CLASES

1. Identificar la clase mediana ( k )

Es la primera clase con una frecuencia acumulada  n / 2

2. Aplicar la fórmula

n
− fa k −1
Me = Lik + ( 2 )c
fk

donde:
fa k-1 es la frecuencia acumulada de la clase que precede a la clase mediana.
Lik es el límite inferior de la clase mediana.
fk es la frecuencia de la clase mediana.
n es el número de datos.
21
Ejemplo 1.21
Para la distribución de frecuencias de los ingresos mensuales en cientos de córdobas de 30 familias
de un sector de Managua presentada por la tabla 1.4 del ejemplo 1.6, calcule el ingreso mensual
mediano de las familias.

fj
Ingresos No. familias faj

36 ---- 48 4 4
48 ---- 60 8 12
60 ---- 72 10 22
72 ----84 5 27
84 ---- 96 3 30
30

1. n / 2 = 15 La primera clase con una fa.  15 es k = 3

15 − 12 3
2. Me = 60 + ( )12 = 60 + (12) = 63.6 cientos de córdobas
10 10

Ejemplo 1.22
Los siguientes datos representan ventas anuales registradas en millones de córdobas en 80 tiendas

Tabla 1.13

Ventas N° tiendas faj

Hasta 10 8 8
10 ---- 20 18 26
20 ---- 30 32 58
30 ---- 40 15 73
40 ---- 50 6 79
Más de 50 1 80

80

Calcule la venta anual mediana de las tiendas.

n
1. = 40 La primera clase con una fa  40 es k = 3
2

40 − 26 140
2. Me = 20 + ( )10 = 20 + = 20 + 4.375 = 24.375
32 32
22
LA MODA
La moda de un conjunto de datos es aquel valor que se presenta con mas frecuencia.
La moda no es afectada por valores extremos. Sin embargo sólo se utiliza para propósitos descriptivos
porque es más variable para distintas muestras que las demás medidas de posición.

DATOS NO AGRUPADOS EN CLASES

Ejemplo 1.23
Los siguientes datos corresponden a ventas mensuales de una empresa registradas en millones de
córdobas durante el año pasado.

100, 80, 150, 60, 100, 90, 130, 100, 90, 100, 120, 100

¿Cuál fue la venta mensual modal de la empresa?

Mo = 100

La moda puede no existir, incluso si existe puede no ser única.

Ejemplo 1.24
60, 74, 82, 85, 90 La moda no existe

Ejemplo 1.25
50, 60, 70, 60, 50, 40, 80, 50, 60, 45

Mo = 50 y Mo = 60

DATOS AGRUPADOS EN CLASES

1. Identificar la clase modal ( k )


Es la clase con la más alta frecuencia.

2. Aplicar la fórmula

Δ1
Mo = Lik + ( )c
Δ1 + Δ 2

donde:
Lik es el límite inferior de la clase modal.
1 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
precedente.
2 es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase
siguiente.
23
Ejemplo 1.26
Para la distribución de frecuencias de los ingresos mensuales en cientos de córdobas de 30 familias
de un sector de Managua presentada por la tabla 1.4 del ejemplo 1.6, calcule el ingreso mensual modal
de las familias.

fj
Ingresos No. familias

36 ---- 48 4 1 = 10 − 8 = 2
48 ---- 60 8
60 ---- 72 10  2 = 10 − 5 = 5
72 ---- 84 5
84 ---- 96 3

30

1. La clase con la mayor frecuencia es la tercera, esto es, k = 3


2.
2
Mo = 60 + ( )12 = 60 + 3.4286 = 63.4286 cientos de córdobas
2+5

1.4.1.2 MEDIDAS DE POSICION NO CENTRAL

PERCENTILES
Son medidas que dividen a una distribución en cien partes iguales.
El percentil r, denotado por Pr, donde r = 1, 2, ........, 99 es el valor por debajo del cual queda el r%
de los datos.

DATOS NO AGRUPADOS
Para obtener el Pr de un conjunto de n datos se procederá así
1. Ordene los datos según su magnitud en orden creciente.
r
2. El percentil Pr será el valor correspondiente a la posición (n + 1)
100
Según la siguiente regla:
i) Si el valor de la posición resultante es un entero entonces su valor correspondiente es el Pr
ii) Si el valor de la posición resultante se encuentra a mitad entre dos posiciones, entonces se toma
el promedio de sus valores correspondientes.
iii) Si el valor de la posición resultante se encuentra entre dos posiciones, pero no a mitad, entonces
se redondea a la posición entera más cercana.

Ejemplo 1.27
Para los resultados de la encuesta del ejemplo 1.3 de la página 7, calcule aproximadamente por
debajo de qué ingreso mensual está el 30% de las familias.
0.30(30+1) = 0.30(31) = 9.3  9ª posición Luego P30 = 57
24
DATOS AGRUPADOS
1. Identificar la clase que contiene al Pr (k)
r
Es la primera clase con una frecuencia acumulada  n( )
100

2. Aplicar la fórmula
r
n( ) − fa k −1
Pr = Lik + ( 100 )c
fk
donde
n es el número de datos
Lik es el límite inferior de la clase que contiene al Pr
r
n( ) es el r% de n
100
fk es la frecuencia de la clase que contiene al Pr
fak-1 es la frecuencia acumulada de la clase que precede a la clase que contiene al Pr.

Ejemplo 1.28
Dada la distribución de frecuencias de la tabla 1.11 del ejemplo 1.17, ¿Por debajo de qué ingreso
mensual está el 80% de las familias?

Ingresos fj fa

36 ----- 48 4 4
48 ----- 60 8 12
60 ----- 72 10 22
72 ----- 84 5 27
84 ----- 96 3 30

30

r 80
1. n( ) = 30( ) = 24 La primera clase con una fa.  24 es k = 4
100 100
24 − 22 24
2 P80 = 72 + ( )12 = 72 + = 72 + 4.8 = 76.8 cientos de córdobas
5 5

¿ Por debajo de qué ingreso mensual está el 60% de las familias?

Nota: verifique que P50= Me


25
1.4.2 MEDIDAS DE DISPERSION
Considere que los siguientes puntos sobre la recta real son los correspondientes a dos conjuntos de
datos.

Posición Posición

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
X

Figura 1.12

¿ Cómo se dispersan los datos y alrededor de qué posición lo hacen ?


¿ Qué conjunto de datos tendría la menor variación?

Cuando la dispersión de los datos se considera pequeña en comparación a la magnitud de los datos
decimos que la medida de posición es confiable, esto es, representativa de los datos.

LA VARIANZA , LA DESVIACION ESTANDAR Y EL COEFICIENTE DE VARIACION.

DATOS NO AGRUPADOS EN CLASES


Si x1, x2,..........,xN representan todos los datos poblacionales entonces su varianza poblacional se
denota y define así
N

 (x i − μ) 2
σ2 = .

La desviación estandar poblacional se denota y define así

 = 2

Si x1, x2,..........,xn representan datos muestrales entonces su varianza muestral se denota y define
así
Fórmula abreviada
n

n n
( x i ) 2
 (x i − x)2 x i
2
− .

n
s2 = .
s2 = .

n −1 n −1

La desviación estándar muestral se denota y define así s= s2


26
El coeficiente de variación es una medida relativa de dispersión. Se expresa como porcentaje y es
útil cuando se compara la variabilidad de dos o más conjuntos de datos expresados en diferentes o
iguales unidades de medición.

s σ
Para una muestra CVmtra = (100) Para una población CVpob = (100)
x μ

Ejemplo 1.29
Los siguientes datos representan saldos en miles de córdobas de 5 cuentas de ahorro.

20, 10, 15, 25, 20


Determine:
a) El saldo promedio de las cuentas
b) La varianza y la desviación estándar de los saldos
c) El coeficiente de variación

xi (x i − x) 2 x2i

20 4 400
10 64 100
15 9 225
25 49 625
20 4 400

90 130 1750

90
a) x= = 18
5
130
b) s2 = = 32.50
4
(90) 2
1750 −
s2 = 5 = 1750 − 1620 = 130 = 32.50  s = 32,50 = 5.7009
4 4 4

Tanto la varianza como la desviación estándar de un conjunto de datos son medidas de variabilidad
de los datos alrededor de la media.
La desviación estándar puede interpretarse como una desviación promedio de los datos alrededor de
la media, en otras palabras, cuánto se alejan en promedio los datos de la media.

Para el ejemplo 1.29, podemos decir que la desviación promedio de los saldos de las cuentas alrededor
de C$ 18 es C$ 5.7009 o bien que los saldos se alejan en promedio C$ 5.7009 de la media.

media

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
X
27
5.7009
c) CV = (100) = 31.6717%
18
Este valor no tendrá sentido a menos que lo comparemos con otro conjunto de cuentas.

Consideremos otro conjunto de cuentas:


xi (x i − x) 2 xi2

21 2.25 441
15 56.25 225
25 6.25 625
29 42.25 841

90 107.00 2132

90
a) x= = 22.50
4
(90) 2
2132 −
b) s 2 = 4 = 2132 − 2025 = 107 = 35.6667  s = 35.6667 = 5.9722
3 3 3
5.9722
c) CV = (100) = 26.5431%
22.50
¿Qué conjunto de cuentas tiene el saldo más uniforme?

Datos repetidos
Si los datos forman una distribución de frecuencias de la variable X, la varianza muestral se define así

 (x i − x) 2 f i
s2 = .

n −1

Ejemplo 1.30
Para la distribución de frecuencias de la tabla 1.1 del ejemplo 1.2, calcule la desviación estándar del
número de hijos de las familias. Recordemos que x = 2.3 hijos.

xi fi (x i − x) 2 f i

0 2 10.58
1 5 8.45
2 10 0.9
3 9 4.41
4 3 8.67
5 1 7.29

30 40.3
40.3
s2 = = 1.3896...  s = 1.1788 cientos de córdobas ¿ Cómo interpretaría este resultado ?
29

DATOS AGRUPADOS EN CLASES


28
La varianza poblacional se denota y define como
mj es la marca de la clase j
g es en número de clases
g

 (m j − μ) 2 f j
σ2 = .
fj es la frecuencia de la clase j
N

La desviación estándar poblacional se denota y define como

 = 2

La varianza muestral se denota y define como


Fórmula abreviada.
g

g g ( m jf j ) 2
 (m j − X)2 f j m fj −
2 .
j
n
s2 = .
s2 = .

n −1 n −1

La desviación estándar muestral se denota y define como

s= s2

El coeficiente de variación se denota y define así

s 
Para una muestra CVmtra = (100) Para una población CVpob = (100)
x 

EJEMPLO 1.31
Para la distribución de frecuencias de los ingresos mensuales en cientos de córdobas de 30 familias
de un sector de Managua presentada por la tabla 1.4 del ejemplo 1.6.
1. ¿Cuál es el ingreso promedio de las 30 familias?
2. ¿Cuál es la varianza y la desviación estándar del ingreso de las familias?

fj
Ingresos mj No. familias mjfj mj2fj

36 ---- 48 42 4 168 7056


48 ---- 60 54 8 432 23328
60 ---- 72 66 10 660 43560
72 ---- 84 78 5 390 30420
84 ---- 96 90 3 270 24300

30 1920 128664
29
1920
1. x= = 64 cientos de córdobas
30
(1920) 2
128664 −
2. s2 = 30 = 128664 − 122880 = 5784 = 199.44827...
29 29 29
s = 199.44827... = 14.1226 cientos de C$ ¿Cómo interpretaría este resultado?

Aplicando la otra fórmula

mj fj (m j − x) 2 f j

42 4 1936
54 8 800
66 10 40
78 5 980
90 3 2028

29 5784

5784
s2 = = 199.44827...
29

Ejercicio 1.1
En la siguiente tabla se dan los rendimientos en qq / mz. obtenidos en 60 plantaciones de algodón.
Tabla 1.13
Rendimientos N° Plantaciones

20 ---- 28 4
28 ---- 36 20
36 ---- 44 30
44 ---- 52 5
52 ---- 60 1

60

1. ¿Cuál es el rendimiento promedio de las 60 plantaciones?


2. ¿Cuál es la varianza y la desviación estándar del rendimiento de las plantaciones?
3. Calcule el coeficiente de variación.
30
1.4.3 MEDIDAS DE ASIMETRIA
1.4.3.1 RELACION ENTRE MEDIA, MEDIANA Y MODA.
Las diferencias entre los valores de la media, la mediana y la moda permiten saber la forma de la
distribución de frecuencias

DISTRIBUCIONES SIMETRICAS
Si en una distribución de frecuencias, la media, la mediana y la moda coinciden entonces decimos que
la distribución es simétrica. Ver figura 1.13

20
15
15
10 10
10
5 5
5

Figura 1.13

DISTRIBUCIONES ASIMETRICAS
Si los valores de la media, la mediana y la moda no coinciden entonces decimos que la distribución
es asimétrica.
Para distribuciones asimétricas unimodales las posiciones relativas de las tres medidas serán tales que
la mediana estará siempre entre la media y la moda. Ver figuras 1.14 y 1.15

▪ Distribución asimétrica a la izquierda o negativa.

40 34
28
30 25
20
20 15

10 5 7

0
Media Me Mo

Figura 1.14

La cola mayor se extiende a la izquierda o dirección negativa y por tanto la media es la menor de las
tres medidas.
x < Me < Mo
31
▪ Distribución asimétrica a la derecha o positiva.

50
40
40 33
28 26
30
18
20
10
10 5
0
Mo Me Media

Figura 1.15
La cola mayor se extiende a la derecha o dirección positiva motivo por el cual la media es la mayor
de las tres medidas.
Mo < Me < x

RELACION EMPIRICA ENTRE LA MEDIA , LA MEDIANA Y LA MODA


Para distribuciones moderadamente asimétricas la mediana se aleja aproximadamente de la media un
tercio de la distancia entre la media y la moda.

 x - Mo  = 3  x - Me   Mo = 3Me - 2 x

Ejemplo 1.32

Retomando los resultados obtenidos de la tabla 1.4 del ejemplo 1.6 tenemos que:

x =64 Me =63.6 Mo =63.4286

Por lo tanto la distribución tiene una asimetría a la derecha.


Verifiquemos ahora la relación empírica determinando la moda:

Mo = 3 (63.6) – 2 ( 64 ) = 190.8 – 128 = 62.8

La diferencia puede deberse a errores de redondeo o bien a que la distribución no es tan


moderadamente asimétrica.
32
1.4.3.2 COEFICIENTE DE ASIMETRIA DE PEARSON
Una medida posible de la asimetría de una distribución de frecuencias es la diferencia ( x − Mo )
dividida por s, esto es,
x − Mo
s
Una medida adimensional, es decir, invariable ante cambios de escala y de origen.
Pero como ( x − Mo) = 3(x − Me) consideraremos, para distribuciones moderadamente asimétricas y
en forma de campana, el siguiente indicador que llamaremos coeficiente de asimetría de Pearson.

3(x − Me) 3(μ − Me)


P= para una muestra P= para una población
s σ

Apoyándonos en este coeficiente diremos que:

Si P = 0 entonces la distribución es simétrica.


Si P  0 entonces la distribución tiene asimetría negativa.
Si P  0 entonces la distribución tiene asimetría positiva.

Nota: Entre más alejado de cero este el valor de P, más asimétrica será la distribución.

Ejemplo 1.33
Para la distribución de frecuencias de los ingresos mensuales de las 30 familias de un sector de
Managua del ejemplo1.6 tenemos que

3(64 − 63.6)
P= = 0.0849...
14.1226

Por lo tanto la distribución tiene asimetría positiva.

1.4.3.3 COEFICIENTE DE ASIMETRIA DE FISHER


Introduciremos primero el concepto de momento de una variable con respecto a su media.

Si los datos forman una distribución de frecuencias de una variable X, el momento de orden r de X
con respecto a la media se denota y define como

 (x i − x) r f i
mr = .
, r = 0, 1, 2,…
n

Dando valores a r tenemos:


n

n −1 2  (x
.
i − x) 3 f i
m0 = 1 , m1 = 0 ¿Por qué? , m2 = s , m3 =
n n
33
Un indicador posible de la asimetría de una distribución de frecuencias de una variable X es el
coeficiente de asimetría de Fisher que se denota y define como:

m3 m3
F= para una muestra F= para una población
s3 3

Hemos dividido m3 por s3 para que F sea un número sin dimensiones


Apoyándonos en este coeficiente diremos que:

Si F = 0 , la distribución es simétrica.
Si F  0 , la distribución tiene asimetría negativa.
Si F  0 , la distribución tiene asimetría positiva.

Nota: Entre más alejado de cero este el valor de F, más asimétrica será la distribución.

Ejemplo 1.34
Cómo calcularía el coeficiente de asimetría de Fisher para ejemplo 1.2 donde el responsable de la
investigación socioeconómica había decidido tomar una muestra de 30 familias y la variable de
interés X representaba el número de hijos de cada familia.
En primer lugar debe resumirse y presentarse la información como aparece en la tabla 1.3 del
ejemplo 1.4
xi fi xifi (x i − x) 2 f i (x i − x) 3 f i (x i − x) 4 f i

0 2 0 10.58 -24.334 55.9682


1 5 5 8.45 -10.985 14.2805
2 10 20 0.9 -0.27 0.081
3 9 27 4.41 3.087 2.1609
4 3 12 8.67 14.739 25.0563
5 1 5 7.29 19.683 53.1441

30 69 40.3 1.92 150.691

69 40.3
x= = 2.3 hijos s2 = = 1.3897  s = 1.1788 hijos
30 29

1.92 m 0.0640 0.0640


m3 = = 0.0640 F = 33 = = = 0.0391
30 s 1.17883 1.6380
Por lo tanto la distribución tiene una ligera asimétrica positiva porque está cerca de cero.

La regla empírica
En un conjunto de datos moderadamente asimétricos aproximadamente el 67% de los datos (la
mayoría de los datos) están comprendidos dentro de la distancia de una desviación estándar en torno
a la media, y aproximadamente entre un 90% y 95% de los datos están comprendidos dentro de la
distancia de dos desviaciones estándar en torno a la media.
Para el ejemplo 1.34 podemos decir que aproximadamente un 67% de las familias (la mayoría de las
familias) tienen un número de hijos que varían entre 2.3– 1.1788 = 1.1212 familias y 2.3 + 1.1788
= 3.4788 familias.
34
1.4.4 MEDIDAS DE CURTOSIS
Una vez que la asimetría ha sido determinada, podremos preguntarnos si la distribución es más o
menos apuntada. Este apuntamiento habrá que medirlo comparándolo con cierta distribución de
frecuencias que consideramos normal.

COEFICIENTE DE APLASTAMIENTO DE FISHER


Una medida posible del apuntamiento de una distribución de frecuencias de una variable X será
el coeficiente de Fisher que denotamos y definimos como

m4 m4
K= −3 para una muestra K= −3 para una población
s4 4

donde m4 es el momento de cuarto orden y K es también una medida adimensional


Atendiendo al valor de K se clasifican las distribuciones de frecuencias en:

❑ Mesocúrtica: cuando K = 0 , es decir si es tan apuntada como la normal.


❑ Platicúrtica: cuando K  0 , es decir es menos apuntada que la normal.
❑ Leptocúrtica: cuando K  0 , es decir es más apuntada que la normal.

Ejemplo 1.35
Para la distribución de frecuencias del número de hijos de 30 familias de un sector de Managua
presentada en el ejemplo 1.34, calcule el coeficiente de aplastamiento de Fisher.
150.691
m4 = = 5.0230
30
m 5.0230 5.0230
K = 44 − 3 = 4
−3 = − 3 = 2.6014 − 3 = −0.3986
s 1.1788 1.9309

La distribución es levemente platicúrtica porque se aleja poco de cero.


Entre más se aleje de cero más platicúrtica será.

Leptocúrtica

Mesocúrtica

Platicúrtica

Figura 1.16
35
EJERCICIOS PROPUESTOS

1. Determinar si cada una de las siguientes variables aleatorias es cualitativa o cuantitativa. Si es


cuantitativa, determine si el fenómeno de interés es discreto o contínuo.

a) La marca de computadora personal que usa.


b) La cantidad de tiempo que utiliza por semana la computador personal.
c) El número de empresas que van a la bancarrota cada año en Nicaragua.
d) La cantidad de dinero que se gastó en ropa el mes anterior.
e) El número de pares de zapatos que se poseen.
f) La cantidad de tiempo invertido en comprar ropa el mes anterior.
g) La preferencia política de los nicaragüenses.
h) El número de empleados de una empresa.
i) El principal tipo de transporte que utiliza para ir a la universidad.

2. Suponga que el gerente de una empresa está interesado en determinar si los clientes que
compraron una computadora en los últimos 12 meses están satisfechos con sus productos.
Utilizando la tarjeta de garantía que envían los clientes después de la compra, el gerente está
planeando encuestar 500 de esos clientes.
a) Describa tanto la población como la muestra de interés para el gerente.
b) Describa el tipo de datos que el gerente está interesado en recopilar.
c) Elabore un primer borrador de cuestionario describiendo una serie de tres preguntas cualitativas y
tres cuantitativas que considere apropiadas para esta encuesta. De una definición operativa de cada
variable cuando sea necesario.
d) Elabore un borrador de la carta de presentación necesaria para esta encuesta.

3. Suponga que el presidente de una cadena nacional de corredores de bienes raíces desea investigar
la posibilidad de abrir una sucursal en la región norte del país. Con el propósito de obtener un perfil
de las comunidades que se atenderían, se debe seleccionar una muestra de 400 casas de 10500 casas
unifamiliares en el área geográfica de interés.
a) Describa tanto la población como la muestra de interés para el presidente.
b) Describa el tipo de datos que el presidente está interesado en recopilar.
c) Elabore un primer borrador de cuestionario describiendo una serie de tres preguntas cualitativas y
tres cuantitativas que considere apropiadas para esta encuesta. De una definición operativa de cada
variable cuando sea necesario.
d) Elabore un borrador de la carta de presentación necesaria para esta encuesta.

4. Supongamos que los siguientes datos representan número de días de atraso en el pago de 10 cuentas
de crédito.
1, 2, 1, 0, 2, 1, 2, 3, 0, 2

Si X representa el número de días de atraso en el pago de una cuenta, presente la información anterior
con:
a) una tabla de frecuencias de X
b) un gráfico de frecuencias de X
36
5. Al director de una empresa de entrega de correspondencia, le preocupa el número de cartas
extraviadas por su firma. Para analizar la situación ha recabado la siguiente información durante los
últimos 16 meses:

N° cartas N° meses
0 2
1 4
2 6
3 3
4 1

Si X representa el número de cartas extraviadas por mes, presente la información anterior por medio
de un gráfico de frecuencias de X.

6. El número de empleados de 10 pequeñas empresas fue el siguiente:

2, 3, 3, 4, 4, 4, 4, 5, ,5, 6

Si X representa el número de empleados por empresa, presente la información anterior con:


a) una tabla de frecuencias de X
b) un gráfico de frecuencias de X

7. Los salarios mensuales en dólares de una muestra aleatoria de 50 docentes de una institución de
educación superior varían de 700 dólares a 1000 dólares.
Señale los límites de 6 clases en los que se pudieran agrupar estos valores.

8. Si los precios de alquiler de apartamentos en la ciudad de Managua varían de 150 dólares a 500
dólares.
Señale los límites de 8 clases en las que se pudieran agrupar estos valores
b) ¿Cuáles son las 8 marcas de clase?

9. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar cada una de sus
cuentas de créditos. Se han obtenido los siguientes 30 registros:

27 57 10 35 26 33
26 11 57 72 15 86
16 20 95 40 14 42
42 32 28 13 29 28
45 38 29 21 38 30

a) Construya una distribución de frecuencias que contenga 5 clases.


b) Grafique el histograma, el polígono de frecuencias y la ojiva.
37
10. El siguiente es un arreglo ordenado que representa las proyecciones que realizó una muestra de
30 economistas sobre cambios porcentuales en el Producto Nacional Bruto real para el próximo año.

-3.5 -3.5 -3.4 -3.0 -2.0 -1.5 0.9 1.0 1.1 1.4
1.5 1.8 1.8 1.8 1.8 2.0 2.0 2.1 2.3 2.3
2.3 2.5 2.5 2.8 3.0 3.0 3.2 3.8 4.3 5.5

a) Organice los datos anteriores en 5 clases


b) Dibuje un histograma de frecuencias
c) Dibuje un polígono de frecuencias.

11. Los siguientes datos representan las declaraciones mensuales de impuestos sobre ventas (en miles
de córdobas) que los 30 establecimientos comerciales de la ciudad A presentaron ante el
correspondiente contralor.

9.0 10.3 11.1 9.6 14.5 13.0 6.7 11.0 8.4 10.3
13.0 11.2 7.3 5.3 12.5 8.0 11.8 8.7 10.6 9.5
11.1 10.2 9.9 9.8 11.6 15.1 12.5 14.0 8.6 5.3

a) Organice los datos anteriores en una distribución de frecuencias que contenga 5 clases.
b) Grafique el histograma de frecuencias y la ojiva.
c) Por debajo de qué declaración mensual de impuesto queda el 80% de los establecimientos?
Utilizar los datos no agrupados
12. Los siguientes datos representan el consumo de agua en m3 de una muestra de 40 casas.

73 75 75 79 81 82 83 83
85 87 89 89 89 90 90 90
91 92 94 94 95 95 95 97
97 98 100 100 101 101 103 104
104 104 105 106 107 110 110 111

a) Presente los datos en una distribución de frecuencias de cinco clases.


b) Grafique el histograma de frecuencias e interprete brevemente la gráfica.
c) Por debajo de qué consumo de agua queda el 40% de las casas?
Utilizar los datos no agrupados
38
13. La gran variedad de factores a considerar en la compra de una vivienda, lugar, precio, tasa de
amortización, tipo de construcción y otros hacen que el tiempo que un comprador tarda en llegar a su
decisión final sea muy variable. Los siguientes datos representan la duración de la búsqueda (en
semanas) de 25 compradores de vivienda en cierta población.

15 17 7 15 20
5 3 19 10 3
11 10 4 8 13
9 15 6 2 8
12 1 2 13 4

a) Organice los datos anteriores en 6 clases.


b) Dibuje un polígono de frecuencias.
c) Por debajo de que tiempo de búsqueda tardan el 90% de los compradores de vivienda en llegar a
su decisión final? Utilizar los datos no agrupados
14. Con el propósito de estimar el consumo semanal de tasas de café a nivel nacional, el gerente una
compañía realizó un estudio de mercado mediante una muestra de 200 personas. Los resultados del
estudio se presentan en la siguiente tabla pero están incompletos.

Consumo
No. tasas fj faj frj fraj

0- 2 24 24 0,16 0,16

2 - 4 38 62 0.2 0,41

4 - 6 45 107 0,30 0.57

6 - 8 16 134 0,11 0,82

8 - 10 28 131 0,05 0,87

10 - 12 17 148 0.1 0,99

12 - 14 2 150 0,01

Total 200 1.00

a) Reconstruya la tabla de frecuencia.


b) ¿Cuántas personas toman a lo sumo 8 tasas de café por semana?
c) ¿Qué porcentaje de personas toman más de 10 tasas de café por semana?
39
15. El diario La Prensa realizó en un barrio de Managua una encuesta telefónica, seleccionando una
muestra aleatoria de 400 personas. Los siguientes datos reflejan las respuestas a una pregunta
relacionada con la policía.
En su barrio, ¿son eficientes los servicios que da la policía?
Sí 100
No 250
No sabe o se negó a responder 50

400
1) Convierta los datos a porcentajes y construya
a) Una gráfica de barras
b) Una gráfica de pastel
2) ¿Qué le dicen estos datos?

16. El ministerio de energía de cierto país hipotético aportó la información siguiente con respecto a
la participación porcentual en el mercado de la producción de petróleo crudo, por país, en los años
2013 y 2014

País 2013 2014

Arabia Saudita 50 40
Irán 10 20
México 20 10
Venezuela 20 30

a) Construya una gráfica de barras para el año 2013


b) Construya una gráfica de pastel para el año 2014
c) Construya una gráfica de barras combinada ( para los años 2013 y 2014)

17. Una autoridad urbana desea diseñar una gráfica que muestre a los contribuyentes que asisten a la
próxima reunión, lo que sucede con el dinero que pagan por impuestos. El monto total recolectado es
de C$ 2 millones (de córdobas). Los gastos fueron: C$ 440,000 para escuelas, C$ 1160,000 para
caminos, C$ 320,000 para administración y C$ 80,000 para suministros. Una gráfica de sectores
parece ideal para mostrar el porcentaje de los impuestos que se dedica a caminos, escuelas,
administración y suministros. Convierta las cantidades totales a porcentajes del total general y
represente los porcentajes en una gráfica de pastel.
40
18. En el Anuario Estadístico 2014 se señala que el valor total de todos los bienes y servicios
producidos en Nicaragua, era de 21 mil millones de córdobas incluyendo todos los sectores de la
economía.
Sector económico Porcentaje del PIB

Primarios 22
Secundarios 32
Terciarios 46

T O T A L 100.00

a) Construya una gráfica de barras.


b) Construya una gráfica de pastel.

19. La siguiente tabla refleja el valor de las exportaciones e importaciones en millones de US $


realizadas por Nicaragua del 2003 al 2007.
Años

Concepto 2003 2004 2005 2006 2007

Exportaciones 452 412 305 257 295

Importaciones 807 826 892 761 824

a) Construya una gráfica de barras.


b) Construya una gráfica lineal donde puedan compararse las exportaciones y las importaciones

20. Los siguientes datos representan los ingresos netos como porcentajes de las ventas durante el
año pasado, para una muestra aleatoria de 10 de las compañías industriales más grandes del país:

5.4 , 1.3 , 4.1 , 2.9 , 0.7 , 2.6 , 8.5 , 0.6 , 7.1 , 7.5

a) Calcule el ingreso neto promedio, mediano y modal


b) Calcule la varianza y la desviación estándar de los ingresos netos. ¿Cómo podría interpretar estos
resultados?

21. Los siguientes datos representan los precios (en córdobas) para una muestra de 4 marcas de
leche en polvo en bolsas de 16 onzas de venta en supermercados de la ciudad de Managua.

40, 31, 35, 50

a) Calcule el precio promedio mediano y modal


b) Calcule la varianza y la desviación estándar de los precios. ¿Cómo podría interpretar estos
resultados?
41
22. La revisión de 8 documentos reveló el siguiente número de equivocaciones en cada uno:

2, 4, 2, 3, 2, 0, 1, 0

Determine:
a) El número promedio de equivocaciones.
b) El número mediano de equivocaciones.
c) El número modal de equivocaciones.
d) La desviación estándar del número de equivocaciones.

23. Para el ejercicio número 4 calcule el número promedio y la desviación estándar del número de
días de atraso en el pago de las cuentas.
24. Para el ejercicio número 5 calcule el número promedio y la desviación estándar del número de
cartas extraviadas por mes.
25. Para el ejercicio número 6 calcule el número promedio y la desviación estándar del número de
empleados por empresa.
26. Durante un período de 15 años, los precios promedios de cierto producto fueron de C$ 125, con
una desviación estándar de C$ 25. En un período posterior de 12 años, tuvieron un precio promedio
de C$ 80 con una varianza de C$ 100. ¿En qué período hubo mayor estabilidad de precios?

27. Las ventas de 5 agentes de una Compañía A durante cierto día fue la siguiente:

24, 13, 17, 20, 12 unidades.

Las ventas de 4 agentes de otra compañía B durante ese mismo día fue la siguiente:

34, 28, 35, 20

i) Calcule la venta promedio y la desviación estándar para el grupo de agentes de la


compañía A.
ii) ¿Que grupo de agentes tuvo la menor variación en las ventas?

28. Los salarios por día en dólares de 5 obreros son dados a continuación:

2.50 3.90 3.20 4.20 y 3.70


a) Calcule la suma algebraica de las desviaciones de cada salario con respecto a la media
aritmética.
b) Calcule el salario mediano.

29. Los siguientes datos son los alquileres mensuales en córdobas para una muestra aleatoria de 5
casas del Reparto Bello Horizonte y otra muestra aleatoria de 6 casas del Reparto Altamira.
Bello Horizonte: 300, 250, 350, 400, 300
Altamira: 300, 500, 600, 800, 500
a) Para cada conjunto de datos calcule la media, la desviación estándar y el coeficiente de variación.
b) Qué se puede decir sobre el alquiler de las casas en Bello Horizonte, en comparación con las que
se alquilan en Altamira.
42
30. Dos países A y B venden la misma materia prima en el mercado mundial a los siguientes precio
por kilogramo, en el transcurso de 6 meses:

Cotizaciones en C$ por país


Mes A B
1 4.9 2.9
2 5.0 3.8
3 2.6 3.0
4 4.5 3.5
5 2.3 3.7
6 4.1 5.0

Realice un análisis de los precios de este producto para ambos países.


Sugerencia : Compare los coeficientes de variación y diga a qué país se le presentan condiciones de
mercado más favorable.

31. Una empresa dedicada al comercio minorista ha agrupado sus establecimientos de acuerdo
con el nivel de ventas que realizó cada uno de ellos durante una semana según la tabla anexa.
(en miles de C$)
Venta semanal N° establecimientos

12 - 16 2
16 - 20 3
20 - 24 6
24 - 28 5
28 - 32 4

20
i) Grafique el polígono de frecuencias y el histograma de frecuencias.
ii) Calcule la venta semanal promedio por establecimiento durante la semana.
iii) Calcule la desviación estándar de las ventas semanales e interprete el resultado.
iv) Calcule el coeficiente de asimetría de Pearson y diga qué tipo de asimetría tiene la distribución.

32. La tabla de distribución de frecuencia de la tasa de desempleo en una muestra de 20 grandes


ciudades en 1999 se presenta a continuación.

Tasa de desempleo N° de ciudades


7.0-7.5 2
7.5-8.0 4
8.0-8.5 5
8.5-9.0 4
9.0-9.5 3
9.5-10 2
20

a) construya el histograma y el polígono de frecuencia acumuladas (ojiva )


calcule la media aritmética, la mediana, la moda, la desviación estándar y el coeficiente de variación.
Interprete los resultados.
43
33. El contador de un almacén desea estimar el balance promedio, en dólares de las 10,000 cuentas
de crédito que maneja el almacén. La distribución de frecuencias se representa en la tabla y fue
construida a partir de una muestra de 100 cuentas seleccionadas al azar en los archivos de crédito del
almacén.
Balance de la Cuenta N° de cuentas
0 – 20 10
20 – 40 15
40 – 60 40
60 – 80 22
80 – 100 13
100

a) Grafique:
Histograma, Polígono de frecuencias relativa, Polígono de frecuencia acumulada.
b) Calcule:
La media aritmética, La mediana, La moda
La varianza, desviación estándar y coeficiente de variación.
c) Calcule el coeficiente de asimetría de Pearson, y diga que tipo de asimetría tiene la distribución.

34. Suponga que se realizó un estudio para evaluar el impacto económico del crédito en el sector
campesino de cierta región del norte de Nicaragua. Los créditos otorgados en miles de córdobas por
los mercados financieros de la zona a una muestra de 40 familias se presentan en la siguiente tabla:
Crédito Número de
(miles C$) familias

0 - 10 2
10 - 20 20
20 - 30 10
30 - 40 6
40 - 60 2

Calcule:
a)El monto promedio de los créditos. b) El crédito mediano. c) El crédito modal d) La desviación
estándar y el coeficiente de variación. e) Por debajo de que valor se encuentra el monto del crédito
del 90% de las familias de esa región.
44
35. Una empresa industrial agrupó sus fábricas de acuerdo con el valor de la producción anual de
cada una; se obtuvo la siguiente distribución:
Producción (en millones de C$) No. de fábricas
40-45 7
45-50 10
50-55 11
55-60 9
60-65 8
65-70 7

a) Determine la producción anual promedio de las fábricas.


b) Determine la desviación estándar de las producciones.
c) Calcule el coeficiente de variación.
d) ¿Por debajo de qué valor producen el 70% de las fábricas?
e) Calcule el coeficiente de asimetría de Pearson y diga qué tipo de asimetría tiene la distribución

36. La tabla siguiente muestra la distribución por edades de cabezas de familia en un país dado durante
el año 2000.
Edad de años Número (en millones)
Hasta 25 2.22
25 a 30 4.05
30 a 35 5.08
35 a 40 10.45
40 a 45 9.47
45 a 50 6.63
50 a 55 4.16
Más de 55 1.66

a) Determine la edad mediana y modal.


b) ¿Por qué la mediana es una medida más adecuada que la media aritmética en este caso?

37. El resultado del ordeño de 100 vacas durante una semana computadas las cantidades diarias de
leche obtenidas por cada vaca, fue agrupada según la siguiente distribución.

Cantidad de litros semanales Número de vacas


60-62 5
62-64 18
64-66 42
66-68 27
68-70 8

Calcule:
1. El rendimiento promedio semanal de leche por vaca.
2. El rendimiento más frecuente.
3. La cantidad de leche por debajo de la cual produce el 80% de las vacas.
4. La desviación estándar del rendimiento semanal de leche.
5. Calcule el coeficiente de asimetría de Pearson, luego diga que tipo de asimetría tiene la
distribución.
45
38. Los siguientes datos corresponden a consumos de KWH (Kilowatts – hora ) mensuales de 260
usuarios domiciliares de energía eléctrica de la ciudad de Managua.

KWH N° Clientes

0 --- 75 91
75 --- 150 41
150 --- 225 87
225 --- 300 33
300 --- 375 6
375 --- 450 2

260

a) Calcule el consumo mensual promedio de energía.


b) Calcule la desviación estándar del consumo de energía. Interprete el resultado.
c) ¿ Por debajo de qué consumo queda el 80% de los clientes.
d) Calcule el coeficiente de asimetría de Pearson y diga qué tipo de asimetría tiene la distribución.

39. Cierto día, un departamento Municipal de salubridad midió el peso de la basura en toneladas
recogidas por una muestra de 20 camiones de limpieza. Los datos fueron agrupados en la siguiente
tabla de frecuencias:

Peso de la basura No. Camiones


8 10 5
10 12 9
12 14 3
14 16 2
16 18 1

20

i) Calcule el peso diario promedio de basura que recogen los 20 camiones.

ii) Calcule la desviación estándar del peso diario de basura. Interpretar el resultado.

iii) Calcule el coeficiente de asimetría de Pearson y diga que tipo de asimetría tiene la distribución.

40. Para el ejercicio 4 calcule lo siguiente:


a) El coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la distribución.
b) El coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

41. Para el ejercicio 5 calcule lo siguiente:


a) El coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la distribución.
b) El coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

42. Para el ejercicio 6 calcule lo siguiente:


a) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la distribución.
46
b) Calcule el coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

43. Se ha recogido el número de hoteles de lujo en 20 ciudades de un país, obteniéndose la siguiente


tabla:

N° de hoteles 0 1 2 3
N° Ciudades 2 3 10 5

a) Represente gráficamente la distribución.


b) Calcule el número promedio de hoteles y la desviación estándar del número de hoteles.
c) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la
distribución.
d) Calcule el coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

44. Los siguientes datos representan el número de interrupciones en 15 días de trabajo debidas a fallas
mecánicas en una planta procesadora de alimentos:

3 0 5 1 3 1 3 2 2 0 2 1 2 4 3
a) Resuma los datos en una distribución de frecuencias.
b) Calcule el número promedio de interrupciones y la desviación estándar del número de
interrupciones.
c) Calcule el coeficiente de asimetría de Fisher y diga que tipo de asimetría tiene la distribución.
d) Calcule el coeficiente de aplastamiento de Fisher y diga que tan apuntada es la distribución.

TEMA 2. PROBABILIDADES
OBJETIVOS.
47
1. Construir espacios muestrales y eventos asociados a un experimento aleatorio.
2. Interpretar el concepto de probabilidad de que ocurra un evento y describir los enfoques de
probabilidad.
3. Calcular probabilidades aplicando las reglas de complemento, adición y multiplicación.
4. Calcular probabilidades aplicando los conceptos de probabilidad condicional, regla de la
multiplicación e independencia de eventos.
5. Resolver problemas aplicando el teorema de Bayes.

INTRODUCCION
Debido a l a tolerancia de varias formas de juegos para recreación de la nobleza de Francia e Inglaterra
a mediados del XVII, se suscitó un interés intenso por los juegos de azar, lo cual permitió que
matemáticos como Blaise Pascal, Pierre de Fermat, Jacob Bernoulli, Abraham de Moire y Thomas
Bayes desarrollaran la teoría de las probabilidades.
Como vivimos en un mundo donde somos incapaces de pronosticar el futuro con absoluta certeza, la
necesidad de medir la incertidumbre nos lleva a estudiar la teoría de probabilidades para conocer las
reglas que nos permitirán estudiar los fenómenos aleatorios.
En la actualidad la teoría de la probabilidad constituye el fundamento de la Estadística Inferencial,
una rama de la Estadística con importantes aplicaciones a situaciones en que interviene la
incertidumbre. En tales circunstancias la Estadística Inferencial permitirá hacer estimaciones de
parámetros basados en la información muestral.
Comenzaremos este tema estudiando la terminología que usaremos

2.1 EVENTOS ASOCIADOS A UN EXPERIMENTO ALEATORIO

EXPERIMENTO ALEATORIO ()


Es aquel que al repetirse bajo condiciones aproximadamente idénticas el resultado no es
necesariamente el mismo.
Podríamos decir que todos los juegos de azar son experimentos aleatorios

▪ Lanzar un dado y observar el número de puntos que aparecen en la cara superior.


▪ Elegir al azar un naipe de la baraja común de 52 naipes.
▪ Lanzar una moneda y observar la cara superior.

La característica principal de estos experimentos es la existencia de incertidumbre en el resultado que


se puede obtener al realizar el fenómeno.
También existen otros experimentos que son considerados de naturaleza aleatoria:

Ejemplo 2.1
1: Un contador revisa 10 facturas de una empresa. Luego cuenta el número de facturas con algún
error en su valor total.

Ejemplo 2.2
2: Registrar el tiempo que tarda un estudiante en entregar un exámen.

EL ESPACIO MUESTRAL ( S )
Es el conjunto de todos los resultados posibles de un experimento aleatorio.
A cada elemento de este conjunto le llamaremos punto muestral.
48
Para el ejemplo 2.1

S1 = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }

Aquí decimos que S1 es un espacio muestral discreto porque sus resultados están representados por
valores que tienen interrupción.
Para el ejemplo 2.2
Supongamos el tiempo máximo permitido en entregar el examen es de 2 horas

S2 = ( 0, 2 ]

Aquí S2 es un espacio muestral contínuo porque sus resultados están representados por valores que
no tienen interrupción, es decir, que entre dos resultados posibles siempre existe otro.

EVENTOS
Un evento A respecto a espacio muestral S es un conjunto de resultados posibles del experimento,
esto es, A  S

S
A

Figura 2.1
Para el ejemplo 2.1
Consideremos que el evento A representa “cuenta a lo más 3 facturas con algún error.”

Entonces A = { 0, 1, 2, 3 }

Decimos que un evento A ha ocurrido si el resultado del experimento es un elemento de A.

¿De cuántas maneras puede ocurrir un evento A?

Si #A representa el número de maneras que puede ocurrir el evento A, entonces #A = 4


NOTA. Si S tiene k elementos entonces hay 2k eventos respecto a S

TIPOS DE EVENTOS
Evento imposible ( )
Es un evento que nunca ocurre.   S
Para el ejemplo 2.1
Supongamos que el evento F representa “cuenta 12 facturas con algún error” , entonces F = 

Evento seguro (S )
Es un evento que siempre ocurre.
49
Para el ejemplo 2.1
El evento S1 es un evento seguro.

Evento simple
Es el que describe solamente una característica.
Para el ejemplo 2.1
El evento A es simple.

Evento conjunto
Es el que describe dos o más características.
El evento conjunto de A y B denotado por AB ocurre cuando A y B ocurren juntos.
Para el ejemplo 2.1
Supongamos que el evento B representa “cuenta un número impar de facturas con algún error”, esto
es,
B = {1, 3, 5, 7, 9 }
Entonces
AB representa “cuenta a lo más 3 y un número impar de facturas con algún error.”

AB = {1, 3 } es un evento conjunto y #(AB) = 2

S
A
B AB

Figura 2.2

Evento unión
El evento unión de A y B denotado por AB es aquel que ocurre si A ocurre ó B ocurre ó si ocurren
ambos.

Para el ejemplo 2.1


AB representa “cuenta a lo más 3 ó un número impar de facturas con algún error.”

AB = { 0, 1, 2, 3, 5, 7, 9 } y #(AB) = 7

Evento complementario
El evento complementario de A denotado por A’ es aquel que ocurre si A no ocurre.
50

A’ S
A

Figura 2.3

Para el ejemplo 2.1


A’ representará lo contrario de A, esto es, A’ representa “cuenta al menos 4 facturas con algún error.”
A = {4, 5, 6, 7, 8, 9, 10}

NOTA: AA’ =  y AA’ = S

EVENTOS MUTUAMENTE EXCLUYENTES


Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir simultáneamente , esto es, si

AB = 

Para el ejemplo 2.2


Supongamos que el evento M representa “entrega el examen después de 1 hora” y el evento R
representa “entrega el examen antes de 2 horas.”
Son los eventos M y R mutuamente excluyentes? No porque MR  

EVENTOS COLECTIVAMENTE EXHAUSTIVOS


Los eventos A1, A2 ,… , An son colectivamente exhaustivos si A1A2 ............An = S
Esto es, si por lo menos uno de ellos debe ocurrir durante un experimento.

Para el ejemplo 2.2


Supongamos que el evento A1 representa “ entrega el examen antes de 1 hora” y que el evento A2
representa “entrega el examen en una hora o más.”
Estos eventos son mutuamente excluyentes y colectivamente exhaustivos.

2.2 ENFOQUES DE PROBABILIDAD


El propósito de la teoría de probabilidad es asignar un número a cada evento A, que represente una
medida de la incertidumbre de que ocurra A, el cual llamaremos probabilidad de A y lo denotaremos
así
P(A)

La probabilidad de cualquier evento indicará que tan factible es que ocurra el evento, entre mayor sea
la probabilidad, más grande será la factibilidad de que ocurra el evento.
Ahora estaremos interesados en cómo obtener P(A)

2.2.1 ENFOQUE DE PROBABILIDAD CLASICA A PRIORI


Aquí suponemos que el experimento no se realiza y que además todos los resultados posibles del
experimento se consideran igualmente probables.
51
Según la historia es la manera más antigua de medir incertidumbre, teniendo su origen en los juegos
de azar.
Número de maneras que puede ocurrir A #A
P(A) = =
Número de resultados posibles del experimento #S

Ejemplo 2.3
Una empresa tiene 200 cuentas por cobrar de las cuales se sabe que 50 tienen un saldo menor que C$
12000. Un auditor selecciona una al azar, ¿ cuál es la probabilidad de que tenga un saldo menor que
C$ 12000 ?

Supongamos que el evento A representa que la cuenta tiene un saldo menor que C$12000.
50
Entonces P(A) = = 0.25
200

2.2.2 ENFOQUE DE PROBABILIDAD CLASICA A POSTERIORI (EMPIRICA)

Aquí suponemos que el experimento se realizó un número n (suficientemente grande) de veces del
cual se observó el número x veces que ocurrió el evento A. De manera que esta probabilidad puede
verse como una frecuencia relativa observada del evento A obtenida de repetir el experimento un
número grande de veces.

Número de veces que ocurrió A x


P( A ) = =
Número de veces que se repitió el experimento n

Ejemplo 2.4
La demanda de un artículo durante 360 días de cierto año ha sido la siguiente:

Tabla 2.1

N° artículos N° días

1 100
2 40
3 90
4 50
5 80

360

Suponiendo que el comportamiento de la demanda para el próximo año será similar al anterior,
¿cuál es la probabilidad de que cierto día:

i) la demanda sea de 4 artículos


Supongamos que el evento A representa que la demanda es de 4 artículos
52
50
P(A) = = 0.1389
360

ii) la demanda sea de por lo menos 3 artículos


Supongamos que el evento B representa que la demanda es de por los menos 3 artículos
220
P (B) = = 0.6111
360

2.2.3 ENFOQUE DE PROBABILIDAD SUBJETIVA

Se basa en una combinación de la experiencia, la opinión personal y el análisis de una situación en


particular. Es útil cuando no se pueden utilizar los enfoques anteriores.

Ejemplo 2.5
Suponga que un profesor de Estadística quiere determinar la probabilidad de que un determinado
estudiante de su clase pase el primer parcial.
Basado en lo que sabe del estudiante sobre:
i) La disciplina que muestra en clase
ii) Las preguntas que hace durante la clase
iii) Las respuestas que da cuando se le pregunta
iv) Las evaluaciones obtenidas en los sistemáticos
v) El grado de interés o esfuerzo que muestra en comprenderle a la asignatura

El profesor selecciona en número, digamos 0.80.

2.3 REGLAS BASICAS DE PROBABILIDAD

1. P ( ) = 0 y P(S)=1

2. Para cualquier evento A, 0  P( A )  1

3. Si A y B son eventos mutuamente excluyentes entonces

P( A  B ) = P( A) + P( B )

4. Regla del complemento.


P(A) + P( A’ ) = 1  P( A’ ) = 1 – P( A )

5. Regla de la adición.
Sean A y B eventos cualesquiera

P( A  B ) = P( A ) + P( B ) – P( A  B )

Ejemplo 2.6
Supongamos que para cierto día de negociaciones de una acción, los siguientes eventos:
A representa que el precio se mantiene sin cambios
53
B representa que el precio sube

Consideremos que P(A) = 0.64 y P( B ) = 0.21

Cuál es la probabilidad de que:


i) el precio cambie

Supongamos que el evento A’ representa que el precio cambia

P( A’ ) = 1 – P( A ) = 1 – 0.64 = 0.36

ii) el precio se mantiene sin cambios y el precio sube.

P( A B ) = P(  ) = 0

iii) el precio se mantiene sin cambios o el precio sube.

P(A  B ) = P( A ) + P( B ) = 0.64 + 0.21 = 0.85

Ejemplo 2.7
Recordemos la encuesta socioeconómica del ejemplo 1.1 del tema 1, donde habíamos decidido
tomar una muestra aleatoria de 30 familias de un sector de Managua. Entre las preguntas
recordemos la 1 y la 3 que decían respectivamente lo siguiente:
“¿Qué tipo de trabajo tiene? Formal o Informal?
¿El balance económico actual de la familia señala? Ahorro, Deuda, Ninguno
La encuesta reveló que de las 30 familias en 5 su balance era ahorro, en 11 su balance era deuda y en
14 su balance era ninguno. Además de las 17 familias con trabajo formal 3 tenían un balance de
ahorro y 5 de deuda.

1) Elabore una tabla de contingencia (o de clasificación cruzada)

(A)Ahorro (D)Deuda (N)Ninguno Total

(F) Formal 3 5 9 17
(I) Informal 2 6 5 13

Total 5 11 14 30

2) Si se selecciona al azar una familia de ese sector, determinar la probabilidad de que:

i) tenga trabajo formal

Número veces ocurrió F 17


P(F ) = = = 0.5667
Número veces se repitió el experimento 30

i) tenga trabajo informal

P( I ) = 1 – P( F ) = 1 – 0.5667 = 0.4333
54

ii) su balance señale ahorro

5
P( A ) = = 0.1667
30

iii) tenga trabajo formal y su balance señale ahorro

Nº veces ocurrió (H  I) 3
P( F A ) = = = 0.1
Nº veces se repitió el experimento 30
iv) tenga trabajo informal o su balance señale deuda

13 11 6 18
P( I  D ) = + − = = 0.6
30 30 30 30

v) tenga trabajo formal o informal vii) tenga trabajo formal e informal

P( F  I ) = P( F ) + P( I ) = 0.5667 + 0.4333 = 1 P(F I ) = P(  ) = 0

2.4 PROBABILIDAD CONDICIONAL


La probabilidad de que un evento A ocurra supuesto que otro evento B ha ocurrido se denota y define
como:
Probabilidad conjunta de A y B
P(A  B)
P(A | B) = =
P(B)
Probabilidad marginal de B

Mide en cierto sentido la probabilidad relativa de A con respecto al espacio reducido B

# (A  B)
Si B es finito entonces P(A | B) =
#B

S
B
A AB

Figura 2.4

Ejemplo 2.8
Para el ejemplo 2.7
55
viii) Suponga que la familia señalada tiene trabajo formal, ¿cuál es la probabilidad de que su
balance señale ahorro
3
P(A  F) 30 3
P( A F ) = = = = 0.1765
P(F) 17 17
30
Nº veces ocurrió (A  F) 3
P( AF ) = = = 0.1765
Nº veces ocurrió F 17

ix) Suponga que en la familia seleccionada su balance señala deuda, ¿cuál es la probabilidad de
que tenga trabajo informal?

Nº veces ocurrió (I  D) 6
P( I D ) = = = 0.5454
Nº veces ocurrió D 11

2.4.1 REGLA DE LA MULTIPLICACION


Sean A1 y A2 eventos

P(A1  A 2 )
Sabemos que P(A 2 | A1 ) =  P(A1  A 2 ) = P(A1 )P(A 2 A1 )
P(A1 )

La probabilidad de A1 A2 es igual a la probabilidad del primer evento A1 por la probabilidad del
segundo evento A2 dado que el primer evento A1 ya ocurrió.

2.4.2 INDEPENDENCIA ESTADISTICA


Dos eventos A1 y A2 son independientes si y sólo si

P(A1 A2 ) = P( A1 ) ó P(A2 A1 ) = P(A2)

Si dos eventos A1 y A2 son eventos independientes entonces según la regla de la multiplicación

P( A1 A2 ) = P(A1 ) P(A2 )

Ejemplo 2.9
Para el ejemplo 2.7

x) Determinar si tener un trabajo informal es estadísticamente independiente del evento tener un


balance que señale deuda.
Comprobemos si P( I D ) = P( I )

Sabemos que P( I  D ) = 0.5454 y que P( I ) = 0.4333 Luego I, D no son eventos


independientes.

Ejemplo 2.10
Durante un período específico, el 80% de las acciones ordinarias de una industria que tiene 10
acciones, han aumentado en valor comercial.
56
Un inversionista selecciona aleatoriamente 2 de esas acciones:

1) Elabore un árbol de probabilidad que describa gráficamente la secuencia de las dos selecciones

Consideremos los siguientes eventos:


A: ha aumentado en valor , N: no ha aumentado en valor
donde el subíndice indicará la posición secuencial de la acción.
Como el 80% de 10 es 8, entonces hay 8 acciones que han aumentado en valor y 2 que no han
aumentado en valor.

7/9 A2 ( 8/10 )( 7/9 ) = 56/90 = 0.6222

A1
8/10
2/9 N2 (8/10 )( 2/9 ) = 16/90 = 0.1778

8/9 A2 (2/10 )( 8/9 ) = 16/90 = 0.1778


2/10
N1

1/9 N2

Figura 2.5

2) ¿Cuál es la probabilidad de que:

i) ambas hayan aumentado en valor comercial?


8 7 56
P( ambas hayan aumentado ) = P(A1 A2) = P( A1)P(A2 | A1 ) =  = = 0.6222
10 9 90
ii) una haya aumentado en valor comercial?

P( una haya aumentado ) = P( A1 N2 ) + P( N1 A2 )

= P(A1)P(N2 | A1) + P( N1)P( A2 | N1) Regla de la multiplicación.

8 2 2 8 16 16 32
=  +  = + = = 0.3556
10 9 10 9 90 90 90

2.5 TEOREMA DE LA PROBABILIDAD TOTAL

Supongamos un experimento aleatorio con su correspondiente espacio muestral S, decimos que los
eventos A1 , A2 ,.........., An forman una partición del espacio muestral S, si se cumple que:
57

i) Ai  Aj =  para todo i  j
ii) A1 A2  .......... An = S

y que B es otro evento respecto a S.

Entonces P(B) = P(A1)P(BA1) + P(A2)P(BA2) + ......... + P(An)P(B | An)


n
=  P(A )P(B A )
.
i i

Cada vez que se realice el experimento aleatorio anterior podemos presentar mediante un árbol de
probabilidad todos sus resultados posibles con sus correspondientes probabilidades.

P(BA1) B
A1
P(A1) B’

P(A2) P(BA2) B
A2
B’
. .
P(An) . .
. .
.
. P(BAn) B
An
B’

Figura 2.6

2.6 TEOREMA DE BAYES


Queremos saber ahora, cuál es la probabilidad de que Ai sea la causa de la ocurrencia de B.

P(A i )P(B A i ) P(A i )P(B A i )


P(A i B) = n
=
 P(A )P(B A )
P(B)
i i
.

Ejemplo 2.11
Un gerente de crédito clasifica las cuentas a su cargo en 3 tipos:
Tipo 1: buen pagador Tipo 2: pagador atrasado Tipo 3: mal pagador
De los archivos se estima que el 75%, 20% y 5% de las cuentas caen en las categorías 1, 2 y 3
respectivamente. Por experiencia en el trabajo el gerente considera que el 90% de los clientes con
58
cuentas del tipo 1 tienen casa propia, mientras que el 50% de los clientes con cuentas del tipo 2 y el
20% de los clientes con cuentas del tipo 3 tienen casa propia.
i) ¿ Cuál es la probabilidad de que una nueva aplicación de crédito corresponda a un cliente con
casa propia ?
ii) Suponga que la nueva aplicación corresponde a un cliente con casa propia, ¿ cuál es la
probabilidad de que sea pagador atrasado?

Consideremos los siguientes eventos:


S: todas las cuentas a cargo del gerente
A1: la cuenta es del tipo 1 A1, A2, A3 forman una partición de S
A2 : la cuenta es del tipo 2
A3: la cuenta es del tipo 3
B: el cliente tiene casa propia.

0.90 B 0.75(0.90) = 0.675


A1
0.10 B’
0.75
0.20 0.50 B 0.20(0.50) = 0.100
A2
0.50 B’
0.05
0.20 B 0.05(0.20) = 0.010
A3
0.80 B’
0.785
Figura 2.7

i)
P(B) = P(A1) P(BA1) + P(A2) P(BA2) + P(A3) P(BA3)
= 0.75(0.90) + 0.20(0.50) + 0.05(0.20) = 0.785

ii)
P( A2 ) P( B | A2 ) 0.20(0.50)
P(A2B) = = = 0.1274
P( B) 0.785

Ejercicio 2.1
El departamento de crédito de una tienda informó que el 30% de sus ventas son en efectivo, el 30%
se pagan con cheques y el 40% son al crédito. Se tiene información de que las compras por más de
C$ 500 en efectivo, con cheques y al crédito son el 25%, 90% y 60% respectivamente
Un persona acaba de decidir comprar un artículo cuyo precio es de C$ 800, ¿ cuál es la probabilidad
de que pague con cheque ?

EJERCICIOS PROPUESTOS

1. Para cada una de las siguientes situaciones, indique cuál de los enfoques (clásico a priori, clásico
empírico o subjetivo) sería más útil para determinar el valor de probabilidad adecuado.
59
a) La probabilidad de que de un envío de 20 repuestos, del cual se sabe que 3 son defectuosos, un
repuesto escogido aleatoriamente resulte defectuoso.
b) La probabilidad de que haya una recesión el año entrante.
c) La probabilidad de que la demanda de un artículo, que produce una empresa, sea de 400 unidades
para el próximo mes.
d) La probabilidad de que un liberal gane la siguiente elección presidencial en Nicaragua.
e) La probabilidad de que el dólar se cotice a C$ 20 a finales de este año.
f) La probabilidad de que al seleccionar al azar una persona de una clase, que tiene 20 mujeres y 8
hombres, el resultado sea una mujer.
g) La probabilidad de que las ventas de un artículo que producen una fábrica suban debido al nuevo
nombre.

2. Para cada uno de los siguientes casos, diga si los eventos que se crean son (i) mutuamente
excluyentes, (ii) colectivamente exhaustivos.

a) A los votantes registrados se les preguntó si son liberales o sandinistas.


b) Los encuestados se clasificaron como propietarios de automóviles en las categorías norteamericano,
europeo, japonés, ninguno.
c) A las personas se les preguntó: “¿Actualmente vive en (i) un apartamento (ii) una casa?”.
d) Un producto se clasificó como: (i) defectuoso (ii) no defectuoso.
e) A las personas se les preguntó “¿tiene intención de comprar un televisor a colores en los siguientes
seis meses?” (i) si, (ii) no.
f) Un país obtuvo un crecimiento económico del (i) 5% al año (ii) 7% al año.
g) Se clasificaron las ventas anuales en (i) a lo más cinco millones de córdobas (ii) de más de cinco a
diez millones (iii) de más de diez millones.
h) En un tipo de industria se clasifican las utilidades anuales en (i) entre uno y siete millones de
córdobas (ii) de cinco millones o más.
i) En una fábrica se clasifican las partes defectuosas de la producción en: (i) menos del 7%. (ii) más
del 2%, (iii) igual al 5% de la producción.
j) La situación económica de un país se describe: (i) crecimiento real del PIB del 3% anual, (ii)
inflación 7% por año (iii) desempleo del 8% de la fuerza laboral.

3. Determine el valor de probabilidad aplicable a cada una de las siguientes situaciones: Luego diga
qué enfoque utilizó.
a) La probabilidad de seleccionar aleatoriamente una cuenta por cobrar que está en mora, si el 5% de
las cuentas están en mora.
b) La probabilidad de que una sucursal de una cadena de restaurantes tenga éxito financiero.
El presunto inversionista obtiene información sobre otras sucursales de la cadena, estudia el área
donde se localizará la sucursal y considera el volumen de ventas necesario para el éxito financiero.
Globalmente, el inversionista cree que hay un 80% de posibilidades de que la sucursal tenga éxito
financiero y un 20% de lo contrario.
c) La probabilidad de accidentes de trabajo en una industria determinada sobre una base anual.
Una muestra al azar de 10 firmas que emplean un total de 8000 personas demostró que ocurrieron 400
accidentes de trabajo durante un período reciente de 12 meses.

4. Una fábrica que produce varillas, debe sacar radiografías de cada varilla e inspeccionarla antes de
embarcarla. Uno de los inspectores, ha notado que por cada 1000 varillas que revisa 10 tienen fallas
en el interior, 8 presentan fallas en la envoltura y 5 tienen ambos tipos de defectos. En su informe
trimestral, debe incluir la probabilidad de fallas de las varillas, ¿Cuál será esa probabilidad?
60
5. La probabilidad de que una nueva política de mercadeo tenga éxito (S) se calculó en 0.60. la
probabilidad de que los gastos para desarrollar la política de mercadeo puedan mantenerse dentro del
presupuesto inicial (B) es 0.50. la probabilidad de que se logren los dos objetivos es 0.30.

a) ¿Cuál es la probabilidad de que se logre por lo menos uno de estos objetivos?


b) ¿Cuál es la probabilidad de que la nueva política de mercado tenga éxito dado que el costo de
desarrollo se mantuvo dentro del presupuesto inicial.
c) ¿Son los eventos S y B estadísticamente independientes?

6. Como parte de un programa de servicio de salud para los empleados de una empresa, se efectúan
exámenes físicos de rutina. Se descubrió que 8% de los empleados necesitaban zapatos correctivos,
15%, trabajos dentales importantes y 3% necesitaban tanto zapatos correctivos como trabajo dental
mayor.
a) Muestre esta situación en un diagrama de Venn.
b) ¿Cuál es la probabilidad de que un empleado seleccionado al azar necesite zapatos correctivos o
trabajo dental mayor?
c) ¿Cuál es la probabilidad de que un empleado necesite zapatos correctivos dado que necesita trabajo
dental mayor?

7. Durante una semana determinada, se estima que la probabilidad de que el precio de una acción
específica aumente (A), permanezca sin cambios (S) o se reduzca (R) es de 0.30, 0.20, y 0.50
respectivamente.
a) ¿Cuál es la probabilidad de que el precio de una acción aumente o permanezca sin cambios?
b) ¿Cuál es la probabilidad de que el precio de la acción cambie durante la semana?
c) ¿Cuál es la probabilidad de que el precio de una acción permanezca sin cambios y se reduzca?

8. De 500 empleados de una empresa, 200 participan en un plan de reparto de utilidades de la empresa
(P) ,400 tiene una cobertura de gastos médicos mayores (M) y 100 participan en ambos programas.
1) Construya un diagrama de Venn para ilustrar los eventos P y M
2) Si se selecciona al azar un empleado de la empresa, ¿cuál es la probabilidad de que:
a) participe en al menos uno de los programas?
b) no participe en ninguno de los programas?
c) sólo tenga cobertura de seguros médicos mayores?

9. De 10 industrias del calzado 3 tienen utilidades anuales mayores que 2 millones de córdobas. Se
selecciona al azar y sin reposición dos industrias.
1) Construya un árbol de probabilidad que describa la secuencia de las dos selecciones.
2) ¿cuál es la probabilidad de que:
a) ninguna tenga utilidades mayores que 2 millones de córdobas?
b) por los menos una tenga utilidades mayores que 2 millones de córdobas?

10. Suponga que de 5 centros recreativos que usted podría visitar el próximo año, 2 de ellos no
tienen piscina. Se decide seleccionar al azar y sin reposición dos centros.
1) Construya un árbol de probabilidad que describa la secuencia de las dos selecciones.
2) cuál es la probabilidad de que:
a) ambos tengan piscina?
b) sólo uno tenga piscina?
c) ninguno tenga piscina?
61

11. En un grupo de clase hay 20 estudiantes de los cuales 16 son de la ciudad de Managua y el resto
procede de otras ciudades. Si un experimento aleatorio consiste en seleccionar dos estudiantes de este
grupo:
a) Elabore un árbol de probabilidades que muestre todas las posibles secuencias de esta selección.
b) ¿Cuál es la probabilidad de que los dos estudiantes seleccionados sean de Managua?
c) ¿Cuál es la probabilidad de que el primero sea de Managua y el segundo de otra ciudad?

12. De 12 cuentas de un archivo, 4 contienen un error de procedimiento al contabilizar los saldos de


las cuentas.
Si un auditor selecciona aleatoriamente:
1) una cuenta, ¿Cuál es la probabilidad de contenga error de procedimiento?
2) Dos cuentas (sin reposición),
i) Elabore un árbol de probabilidad para representar éste proceso secuencial de muestreo.
ii) ¿Cuál es la probabilidad de que ninguna cuenta contenga error de procedimiento?
iii) ¿Cuál es la probabilidad de que una cuenta contenga error de procedimiento?
3) Tres cuentas (sin reposición), ¿Cuál es la probabilidad de que todas contengan error de
procedimiento?

13. De 500 documentos de una empresa 100 no tienen el sello correspondiente. Hay 200 que no
cumplen los requisitos de la empresa, 140 de ellos tienen el sello.
1) Elabore una tabla de contingencia
2) ¿Cuál es la probabilidad de que un documento seleccionado en forma aleatoria:
a) cumpla los requisitos de la empresa?
b) no tenga el sello correspondiente
c) cumpla los requisitos de la empresa y tenga el sello correspondiente?
d) cumpla los requisitos de la empresa o tenga el sello correspondiente?
e) cumpla los requisitos de la empresa dado que tiene su sello correspondiente?

14. De 250 empleados de una compañía tabacalera, un total de 130 fuman. Hay 150 hombres
trabajando en esta compañía; 85 de ellos fuman.
1) Elabore un diagrama de Venn
2) Construya una tabla de contingencia
3) De un ejemplo de evento simple
4) De un ejemplo de evento conjunto
5) ¿Cuál es el complemento de fuma?
6) Si se selecciona al azar y sin reposición un empleado, ¿cuál es la probabilidad de que:
a) fume?
b) sea mujer?
c) sea mujer y fume?
d) sea hombre o fume?
7) de qué fume dado que se sabe que es una empleada de la compañía?
8) ¿Son estadísticamente independientes el fumar y el sexo de la persona? Explique
15. De 100 personas que solicitaron empleo de operador de computadoras en una firma el año pasado,
40 tenían experiencia anterior (E), 30 tenían certificado ( C ), y 20 tenían experiencia anterior y
certificado.

1) Elabore un diagrama de Venn para describir gráficamente estos eventos.


2) Elabore una tabla de contingencia
3) ¿Cuál es la probabilidad de que un solicitante escogido aleatoriamente:
62
i) Tenga experiencia o certificado.
ii) No tenga certificado.
iii) No tenga ni experiencia ni certificado.
iv) Tenga certificado dado que tiene alguna experiencia anterior.
4) Determine si la experiencia y el certificado son eventos independientes.

16. El director de una gran agencia de empleo desea estudiar las diversas características de sus
solicitantes de trabajo. Se ha seleccionado una muestra de 200 solicitantes para su análisis. Sesenta
solicitantes habían tenido sus trabajos actuales durante al menos cinco años; ochenta de los solicitantes
son graduados universitarios; 25 de los graduados universitarios duraron en sus trabajos al menos
cinco años.
a) Construya una tabla de contingencia.
b) ¿Cuál es la probabilidad que un solicitante escogido aleatoriamente?
b.1 Sea un graduado universitario?
b.2 Sea un graduado universitario y haya tenido su trabajo al actual menos de cinco años?
b.3 Sea un graduado universitario o haya tenido su trabajo actual al menos de cinco años?
c) Dado que un empleado particular es un graduado universitario, ¿cuál es la probabilidad que haya
durado en su trabajo menos de cinco años?.
d) Determine si ser graduado universitario y haber durado en el trabajo al menos cinco años son
estadísticamente independientes.

17. En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar
información diversa respecto al comportamiento de los consumidores. Entre las preguntas
formuladas estaba “¿disfruta comprar ropa?”. De 240 hombres, 136 respondieron que sí. De las 260
mujeres, 44 respondieron que sí.
a) Construya una tabla de contingencia para evaluar las probabilidades.
b) Dé un ejemplo de: un evento simple, un evento conjunto.
c) ¿Cuál es el complemento de “disfruta comprar ropa”?
d) ¿Cuál es la probabilidad que un encuestado elegido aleatoriamente del área:
d.1. Sea hombre?
d.2. Disfrute comprar ropa?
d.3. Sea una mujer y disfrute comprar ropa?
d.4. Sea un hombre y no disfrute comprar ropa?
d.5. Sea una mujer o no disfrute comprar ropa’
e) Suponga que el encuestado elegido es un hombre. ¿Cuál es la probabilidad que no disfrute comprar
ropa?
f) ¿Disfrutar de comprar ropa y el sexo del individuo son estadísticamente independientes?.

18. En los datos recolectados en una encuesta sobre la satisfacción de los empleados de la empresa
Omega realizada a una muestra de 400 empleados, los resultados con las categorías desglosadas en
satisfecho y no satisfecho, y progresado y no progresado en la organización, se presentan en la
siguiente tabla de contingencia:

Satisfacción en el Avance
trabajo Progresado ( P ) No progresado ( P’ ) Total
63
Satisfecho ( S ) 194 162 356
No satisfecho ( S’ ) 14 30 44
Totales 208 192 400

1) Determine la probabilidad de que un empleado seleccionado aleatoriamente de la empresa:


a) Esté satisfecho con su trabajo.
b) No haya progresado en la organización.
c) Está satisfecho con el trabajo o ha progresado en la organización.
d) No está satisfecho y no ha progresado
e) Está satisfecho con el trabajo dado que se sabe ha progresado en la organización.
2) ¿Estar satisfecho con el trabajo es independiente de haber progresado en la organización? Explique.

19. Se han llevado acabo numerosos estudios intensivos de la planeación de los consumidores para
la compra de bienes duraderos como televisores, refrigeradores, lavadora, etc. En uno de estos
estudios se preguntó a 1000 individuos de una muestra aleatoriamente seleccionada si estaban
planeando comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a
las mismas personas para ver si realmente compraron una nueva T.V. la respuesta a ambas entrevistas
se tabula de manera cruzada a continuación.

Compraron ( C ) No compraron (C’) Totales


Planearon ( P ) 200 50 250
No planeando ( P’ ) 100 650 750
Totales 300 700 1000

a) Dé un ejemplo de un evento simple y de un evento conjunto.


b) ¿Cuál es el complemento de “planea comprar”?
c) Si un individuo se selecciona aleatoriamente, ¿cuál es la probabilidad de que en el último año.
c.1. Haya comprado una nueva T.V.?
c.2. No haya planeado comprar una nueva T.V.?
c.3. Haya planeado comprar y realmente haya comprado una nueva T.V.?
c.4. Haya planeado comprar o realmente no haya comprado una nueva T.V.?
d) Si el entrevistado no planeo comprar una nueva T.V., ¿cuál es la probabilidad que no haya
comprado una?
e) ¿Planear comprar una T.V. y realmente comprar una son eventos estadísticamente
independientes? Explique.

20. Se ha emprendido una encuesta para determinar si existe una relación entre el lugar de residencia
y la propiedad de un automóvil. Se seleccionó una muestra aleatoria de 500 personas con los
resultados mostrados a continuación:

Propiedad de Área de residencia


automóvil Ciudad (C) Suburbio ( Su) Rural ( R ) Totales
Si ( S ) 90 60 25 175
No ( N ) 110 90 125 325
Totales 200 150 150 500
64
a) Si se selecciona aleatoriamente una persona, ¿cuál es la probabilidad que ésta.
a.1. Posea un automóvil?
a.2. Viva en suburbio?
a.3. Posea un automóvil o viva en una ciudad?
a.4. Viva en el área rural y no posea un automóvil?
b) Suponga que sabemos que la persona seleccionada vive en un suburbio, ¿cuál es la probabilidad
que posea un automóvil?
c) ¿Es el área de residencia estadísticamente independiente de si la persona posea un automóvil?
Explique.

21. Consideremos el caso de un distribuidor de aparatos electrodomésticos que ha estado


promoviendo cierto producto, por medio de una importante campaña publicitaria por televisión. Para
evaluar la efectividad de la campaña, se pregunta a 600 clientes que visitaron la tienda durante un
período, si recuerdan el anuncio de la televisión. Se conservan los registros de las respuestas así como
de la posible compra del producto en cuestión. Los resultados de este estudio se dan en la tabla
siguiente:

Anuncio de
Televisión Recuerda ( R ) Total
No recuerda ( R’ )
Producto

Compra ( C ) 120 60 180

No compra ( C’ ) 80 340 420

Total 200 400 600

1) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que:


a. Recuerde el anuncio?
b. No recuerde al anuncio?
c. Realice una compra o recuerde el anuncio?
d. No recuerde el anuncio y realice una compra?
2) Dado el hecho de que el cliente realizó una compra, ¿cuál es la probabilidad de que haya recordado
el anuncio?
3) Si el cliente no recuerda el anuncio, ¿cuál es la probabilidad de que realice una compra?

22. Una profesora ha estado enseñando Estadística durante muchos años. Sabe que el 80% de los
estudiantes cumplen con los problemas asignados. Determinó que de los alumnos que hacen las tareas,
90% aprobarán el curso. De aquellos estudiantes que no realizan la tarea, 40% aprobarán. Miguel
Sánchez tomó Estadística con la profesora y tuvo calificación aprobatoria ¿cuál es la probabilidad de
que sí haya hecho las tareas?

23. Un comprador de ropa de una gran tienda departamental compra anualmente 20% de las piezas a
un fabricante A, 30% a un segundo fabricante B y el 50% restante a diversos proveedores. De la ropa
comprada a A se vende el 80%; 75% de la de B y 90% de los restantes. ¿Cuál es la probabilidad de
que una pieza que no se vendió al final de la temporada, provenga del fabricante B?
65
24. Martín Pérez, gerente del departamento de crédito de Epsilon, sabe que la compañía utiliza tres
métodos para exhortar a pagar a las personas con cuentas morosas. De los datos que se tienen
registrados, él sabe que 70% de los deudores son visitados personalmente, 20% se les sugiere que
paguen vía telefónica y el restante 10% se le envía una carta. Las probabilidades de recibir alguna
cantidad de dinero debido a los pagos de una cuenta con estos tres métodos son 0.75, 0.60 y 0.65,
respectivamente. El señor Pérez acaba de recibir el pago de una de las cuentas vencidas. ¿Cuál es la
probabilidad de que la petición de pago se haya hecho:
a) Personalmente?
b) Por teléfono?
c) Por correo?

25. El gerente de comercialización de una compañía fabricante de juguete está planeando introducir
un nuevo juguete en el mercado. En el pasado, 40% de los juguetes introducidos por la compañía han
tenido éxito y 60% no lo han tenido. Antes de que se comercialice el juguete, se lleva a cabo un
estudio de mercado y se compila un informe, ya sea favorable o desfavorable. Anteriormente, 80%
de los juguetes exitosos recibieron informes favorables y 30% de los juguetes no exitosos también
recibieron informes favorables.
a) Suponga que el estudio de mercado da un informe favorable sobre el nuevo juguete. ¿Cuál es la
probabilidad de que el nuevo juguete tenga éxito?
b) ¿Qué proporción de los juguetes nuevos reciben informes favorables de estudios de mercado?.

26. Una empresa compra cierto tipo de pieza que es suministrada por tres proveedores: el 45% de las
piezas son compradas al primer proveedor resultando defectuoso el 1%. El segundo proveedor
suministra el 30% de las piezas, y de ellas es defectuoso el 2%. Las restantes piezas provienen del
tercer proveedor, siendo defectuoso el 3% de las mismas. En un control de recepción de artículos se
selecciona una pieza al azar y es defectuosa. Calcular la probabilidad de que la haya suministrado el
segundo proveedor.

27. Un ejecutivo de publicidad está estudiando los hábitos de ver televisión en hombres y mujeres
casados, en horario estelar. En base a registros de observación se ha determinado que los esposos
ven televisión el 60% del tiempo. También se ha determinado que cuando el esposo está viendo
televisión, el 40% del tiempo la esposa también lo hace. Cuando el esposo no está viendo televisión,
el 30% del tiempo la esposa sí lo está haciendo. Encuéntrese la probabilidad de que:
a) si la esposa está viendo televisión, el esposo también lo esté haciendo.
b) la esposa esté viendo televisión durante el horario estelar.

28. Ochenta por ciento de material de vinil que se recibe del vendedor A es de calidad excepcional,
en tanto que solo cincuenta por ciento de material de vendedor B es de calidad excepcional. Sin
embargo, la capacidad de fabricación del vendedor A es limitada y, por esa razón, solo cuarenta por
ciento del vinil que la empresa adquiere proviene de este vendedor. El sesenta por ciento restante se
compra al vendedor B. Se inspecciona un embarque de vinil que acaba de llegar y se encuentre que
es de excepcional calidad. ¿Cuál es la probabilidad de que provenga del vendedor A?

29. En cierta universidad, el 70% de los estudiantes vienen de instituciones privadas y el 30% de
instituciones estatales. Se sabe que el 25% de los estudiantes que vienen de instituciones privadas y
el 10% que vienen de instituciones estatales poseen vehículo propio.
a) Si se selecciona un alumno al azar de esta universidad, ¿cuál es la probabilidad de que tenga
vehículo propio?
66
b) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los que
vienen de instituciones estatales?
c) Si el alumno seleccionado posee vehículo propio, ¿cuál es la probabilidad de que sea de los que
vienen de instituciones privadas?

30. La constructora Cedro, S.A. trata de determinar si debería presentar licitación para la construcción
de un nuevo centro comercial. En el pasado, la principal competidora de Cedro, la constructora Nardo,
S.A. ha presentado licitaciones el 70% de las veces. Si Nardo no presenta licitación sobre un trabajo,
la probabilidad de que Cedro lo obtenga es del 0.50; si Nardo presenta licitación, la probabilidad de
que lo obtenga Cedro es de o.25.
a) Si la constructora Cedro obtienen el trabajo, ¿cuál es la probabilidad de que Nardo no haya
presentado licitación?
b) ¿Cuál es la probabilidad de que la constructora Cedro obtenga el trabajo?

31. Una estación de televisión querría medir la habilidad de su meteorólogo. La información


recopilada señala lo siguiente:
1. La probabilidad de que predijera un día de sol en días soleados es 0.80
2. La probabilidad de que predijera día de sol en días lluviosos es 0.40
3. La probabilidad de un día de sol es 0.60
Encuentre la probabilidad de que:
a) sea un día soleado, sabiendo que ha pronosticado un día de sol.
b) predecirá un día soleado.
67
TEMA 3: DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES
ALEATORIAS
OBJETIVOS
1. Explicar el concepto de variable aleatoria y utilizarlo para definir eventos.
2. Construir la distribución de probabilidad y la función de distribución acumulada de una variable
aleatoria discreta.
3. Calcular e interpretar la esperanza y la varianza de una variable aleatoria discreta.
4. Conocer y aplicar las propiedades de la esperanza y la varianza de una variable aleatoria discreta.
5. Conocer los modelos probabilísticos más comunes de una variable aleatoria discreta y el modelo
más aplicable en Estadística de una variable aleatoria contínua
6. Aplicar el modelo probabilístico más adecuado, según las condiciones experimentales, a la
resolución de problemas

INTRODUCCION
En el tema anterior utilizábamos letras como A, B, C, para representar eventos asociados a un
experimento aleatorio y nos interesaba calcular, digamos P(A). Ahora utilizaremos variables
aleatorias como X, Y, Z, para describir los eventos asociados al mismo experimento aleatorio, pero
ahora el interés será calcular la probabilidad de que la variable aleatoria , digamos X, tome algún valor
particular x. Por tanto, será de mucha utilidad práctica la construcción de distribuciones de
probabilidad de una variable aleatoria X y la determinación de sus características principales.
Más adelante estudiaremos algunas distribuciones clásicas de probabilidad de variables aleatorias
discretas, que llamaremos modelos probabilísticos.
Por ahora podemos iniciar con el concepto de variable aleatoria.

3.1 EVENTOS DEFINIDOS POR VARIABLES ALEATORIAS

VARIABLE ALEATORIA
Sea S el espacio muestral asociado a un experimento aleatorio. Una función X que signa a cada uno
de los elementos w de S un número x, se llama variable aleatoria.

S
x R
w

X (w) = x

Figura 3.1

Ejemplo 3.1
68
De todas las cuentas por cobrar de una empresa, un auditor selecciona al azar y sin reposición 2 de
dichas cuentas y luego registra el número de cuentas con saldos incorrectos.

Definamos los eventos:


C: la cuenta tiene su saldo correcto
I: la cuenta tiene su saldo incorrecto.

S
C2 C1 C2
C1
2 C1 I2

C2 I1 C2
I1
I2 I1 I2

Figura 3.2

Como estamos interesados en registrar el número de cuentas que tienen su saldo incorrecto, es útil
definir una variable aleatoria X que asigne a cada elemento de S su número de cuentas con saldo
incorrecto, o bien de una manera más sencilla, que la variable aleatoria X represente el número de
cuentas con saldos incorrectos.

X
S R
C1 C2 0

C1 I2
1

I1 C2

I1 I2 2

Figura 3.3

Así, X ( C1 C 2 ) = 0 ; X ( C1 I2 ) = 1 ; X ( I1 C2 ) = 1 ; X ( I 1 I2 ) = 2

El recorrido o rango de X es RX = { 0, 1, 2 } que será llamado conjunto de valores posibles de X.

Ejemplo 3.2
Registrar el tiempo que tarda un estudiante en realizar un examen de Estadística.
69
Como el resultado del experimento es ya la característica numérica que queremos registrar entonces
vamos a definir la variable aleatoria X como una función identidad que asigne a cada tiempo w posible
que tarda en realizar el examen el mismo tiempo w, esto es,

X( w ) = w

o bien de una manera más sencilla, que la variable aleatoria X represente el tiempo que tarda el
estudiante en realizar el examen.

VARIABLE ALEATORIA DISCRETA.


X es una variable aleatoria discreta si su conjunto de valores posibles es finito o infinito numerable,
esto es, si sus valores se pueden asociar a los enteros 1, 2, 3, . . . .

Para el ejemplo 3.1, X es una variable aleatoria discreta porque su conjunto de valores posibles es
finito.

VARIABLE ALEATORIA CONTINUA.

X es una variable aleatoria continúa si su conjunto de valores posibles es infinito no numerable, esto
es, para dos elementos cualesquiera de este conjunto siempre existirá otro entre ellos.

Para el ejemplo 3.2, X es una variable aleatoria continúa. Porque entre dos tiempos posibles siempre
existirá otro.

EVENTOS

El conjunto de todas los elementos w de S que tienen asignado (Según X) un mismo valor particular
x, será un evento que denotaremos por X = x . Esto es,

{ w  S | X( w ) = x } es equivalente a X = x.
X
S

x R

Figura 3.4

De manera análoga se definen los eventos


X  x , X  x , a  X  b , X  x , X  x , a  X  b , etc.

Para el ejemplo 3.1, consideremos los siguientes eventos:


70
“Registra 1 cuenta con saldo incorrecto” es equivalente a { C I , I C } que también es equivalente a

X = 1

“Registrar 0 cuentas con saldos incorrectos” es equivalente a { CC } que también es equivalente a

X = 0.

“Registra al menos una cuenta con saldo incorrecto es equivalente a { C I , I C , I I } que también es
equivalente a
X  1

Para el ejemplo 3.2 consideremos los eventos:

“Tarda entre 2 y 4 horas” es equivalente a 2  X  4.

“Tarda a lo sumo 3.5 horas” es equivalente a X  3.5

3.2 DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE ALEATORIA


DISCRETA.

Una distribución de probabilidad de una variable aleatoria X es una función que asigna a cada valor
posible xi un número f (xi ) = P ( X = xi ) llamado la probabilidad de xi tal que:

i) f ( xi )  0
ii)  f ( xi ) = 1

Nota: Para cualquier otro valor que no sea posible f ( x ) = 0

xi R
0 1

Figura 3.5

Ejemplo 3.3
71
Suponga para el ejemplo 3.1 que la empresa tiene 100 cuentas por cobrar de las cuales 30 tienen su
saldo incorrecto. Recordando que X representa el número de cuentas con saldos incorrectos,
construya la distribución de probabilidad de X.

Arbol de probabilidad
69/99 C2 C1 C2 0 0.4879

C1
70/100
30/99 I2 C1 I2 1 0.2121

70/99 C2 I1 C2 1 0.2121
30/100
I1

29/99 I2 I1 I2 2 0.0879

Figura 3.6

Como los valores posibles de X son 0, 1, 2 tendremos:

f ( 0 ) = P ( X = 0 ) = 0.4879
f ( 1 ) = P ( X = 1 ) = 0.2121 + 0.2121 = 0.4242
f ( 2 ) = P ( X = 2 ) = 0.0879

La distribución de probabilidad de X podemos expresarla como:

1. Una tabla
Tabla 3.1
xi f (xi )

0 0.4879
1 0.4242
2 0.0879

1.0000

2. Una función matemática

 0.4879 si x = 0
 0.4242 =1
 si x
f (x) = 
 0.0879 si x = 2
 0 si x es cualquier otro valor

3. Una gráfica.
72

f(x) 0.6
0.5 0.4879
0.4 0.4242
0.3
0.2
0.1 0.0879
0
-1 0 1 2 3

Figura 3.7

3.3 FUNCION DE DISTRIBUCION ACUMULADA DE UNA VARIABLE ALEATORIA


DISCRETA.
Sea f ( x ) la distribución de probabilidad de una variable aleatoria X. La función de distribución
acumulada de la variable aleatoria X se denota y define como:

F(x) = P(X x) =
xi
xf ( x

i ) , -  x  

Ejemplo 3.4
Construir la función de distribución acumulada de la variable aleatoria X del ejemplo 3.3
Retomemos la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3 y observemos
que valores toma F ( x ) cuando: x  0 , 0  x  1 , 1  x  2 y x  2

i) Si x  0 , F ( x ) = 0 porque no hay valores posibles menores o iguales que x


ii) Si 0  x  1 , F ( x ) = f ( 0 ) = 0.4879 porque sólo hay un valor posible, que es el 0,
cuya probabilidad es 0.4879
iii) Si 1  x  2 , F ( x ) = f ( 0 ) + f ( 1 ) = 0.4879 + 0.4242 = 0.9121
porque hay dos valores posibles, que son el 0 y el 1 cuyas, probabilidades son 0.4879 y 0.4242
respectivamente.
iv) Si x  2 , F ( x ) = f ( 0 ) + f ( 1 ) + f (2 ) = 0.4879 + 0.4242 + 0.0879 = 1
porque hay tres valores posibles, que son el 0, 1 y 2, cuyas probabilidades son 0.4879 , 0.4242
y 0.0879 respectivamente.

Los resultados anteriores podemos expresarlos como:


73

1. Una función matemática


0 si x  0
 0.4879 0  x 1
 si
F(x) = 
 0.9121 si 1 x  2
 1 si x  2

2. Una gráfica

1
F(x) 0.9 0.9121
0.8
0.7
0.6
0.5 0.4879
0.4
0.3
0.2
0.1
0 0
-1 0 1 2 3
x

Figura 3.8

Algunas características de F ( x )

a) F ( x ) es siempre una función no decreciente.


b)
Lím F ( x ) = 1 y Lím F ( x ) = 0
x→ +  x→ - 

c) P(a  X  b) = F(b) - F(a)

d) f ( x ) = F ( x ) - F ( x – 1 ) si x es un número natural.

Ejercicio 3.1
74
Las llegadas de clientes a un almacén durante 80 días escogidos aleatoriamente se presenta en la
siguiente tabla.
Tabla 3.2
No. Llegadas No. días

0 15
1 25
2 35
3 5

80

Si X representa el número de llegadas de clientes en un día.

i) Construya la distribución de probabilidad de X


ii) ¿Cuál es la probabilidad de que cierto día lleguen menos de 3 clientes.
iii) Construya la función de distribución acumulada de X
iv) ¿Cuál es la probabilidad de que cierto día lleguen a lo sumo 2 clientes?.

3.4 ESPERANZA Y VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA.

Con el propósito de resumir la distribución de probabilidad de una variable aleatoria discreta X se


calcularán sus principales características: la esperanza y la varianza de X.

Sea f(xi ) una distribución de probabilidad de una variable aleatoria discreta X. La esperanza de X o
valor esperado de X se denota y define como:

E(X) =  xi f ( xi )

E ( X ) puede considerarse como una media aritmética ponderada (donde la ponderación de cada x i
sería la probabilidad f(xi)) esto es la media que espero obtener de un gran número de observaciones
independientes de X, motivo por el cual escribiremos.

E (X ) =  X ( la media de X )

La varianza de X se denota y define como:

V (X) = E [ (X -  X )2 ] =  ( xi -  X )2 f ( xi )

La varianza de X también se puede denotar como V( X ) =   X


El cálculo se puede simplificar utilizando la siguiente fórmula :

V (X) = E ( X2 ) - [ E ( X ) ]2 donde E ( X2 ) =  xi2 f ( xi )


75
La desviación estándar de X se denota y define como:

X = V(X)

Ejemplo 3.5
Para la distribución de probabilidad de la variable aleatoria X del ejemplo 3.3

i) Calcule el número esperado de cuentas con saldos incorrectos (interprete el resultado).

ii) Calcule la varianza y la desviación estándar del número de cuentas con saldos incorrectos
(interprete el resultado)

xi f ( xi ) xi f ( xi ) ( xi - X )2 f ( xi ) xi2 f ( xi )

0 0.4879 0 0.1756 0
1 0.4242 0.4242 0.0679 0.4242
2 0.0879 0.1758 0.1723 0.3516

1.0000 0.6000 0.4158 0.7758

i)
E ( X ) = μ X = 0.6 cuentas con saldos incorrectos.

Este resultado podemos interpretarlo diciendo que a medida que el auditor vaya seleccionando
2 cuentas de las 100 muchas veces esperamos en promedio que 0 (ninguna) ó 1 cuenta con
saldo incorrecto, pero un poco más 1 que ninguna.

ii) V ( X ) =  X = 0.4158   = 0.6448 cuentas con saldos incorrectos


X

Como este valor representa variación de X alrededor de  X, lo interpretaremos diciendo que


la desviación promedio del número de cuentas con saldo incorrecto alrededor de su promedio
0.6 es 0.6448 cuentas con saldos incorrectos. También se puede interpretar según la regla
empírica diciendo que el número de cuentas con saldos incorrectos variará, la mayor parte de
las veces que el auditor seleccione 2 cuentas de las 100, entre 0.60 - 0.6448 y 0.60 + 0.6448,
esto es, aproximadamente entre 0 (ninguna) y 1 cuenta con saldo incorrecto.

Utilizando la otra fórmula tendremos que:

V ( X ) = 0.7758 - [ 0.6 ]2 = 0.4158   = 0.6448


X
76
Ejemplo 3.6
Un vendedor de computadoras tiene la oportunidad de trabajar con cierto comerciante. Supongamos
que el vendedor ha evaluado las posibilidades de la venta semanal de la manera indicada abajo.
Tabla 3.3
No. Computadoras Probabilidad

0 0.1
1 0.2
2 0.3
3 0.4

i) Determine el número de computadoras que espera vender por semana. Interprete el resultado.
ii) Determine la desviación estándar del número de computadoras que vende por semana.
Interprete el resultado.

Hagamos que la variable aleatoria X represente el número de computadoras que podría vender por
semana.

xi f( xi ) xi f( xi ) xi2 f( xi )

0 0.1 0 0
1 0.2 0.2 0.2
2 0.3 0.6 1.2
3 0.4 1.2 3.6

1.0 2.0 5.0

E ( X ) = 2 computadoras y V ( X ) = 5 - [ 2 ]2 = 5 - 4 = 1 computadora2

 = V( X ) = 1 =1 computadora
X

Estos resultados se interpretan así:


A medida que transcurran las semanas, el vendedor espera vender en promedio 2 computadoras y el
número de computadoras que venderá por semana variará la mayor parte de las veces entre 1 y 3
computadoras.

Ejemplo 3.7
77
Un fabricante produce cierto artículo de tal modo que el 10% son defectuosos. Si se produce un
artículo defectuoso, el fabricante pierde C$ 10, mientras que un artículo no defectuoso le produce una
ganancia de C$ 50.
Determine la ganancia esperada por artículo. Interprete el resultado.

Supongamos que X representa la ganancia por artículo y que toma los valores – 10 si se produce un
artículo defectuoso y 50 si se produce no defectuoso.

xi f ( xi ) xi f (xi )

-10 0.10 -1
50 0.90 45

44  X = E ( X ) = C$ 44
Este resultado se interpreta así: Cuando el fabricante produzca muchos artículos espera una ganancia
promedio por artículo de C$ 44

Ejercicio 3.2
Para la distribución de probabilidad de X del ejercicio 3.1
i) Calcule el número esperado de llegadas de clientes (interprete el resultado).
ii) Calcule la varianza y la desviación estándar del número de llegadas de clientes (interprete el
resultado).

3.4.1 PROPIEDADES DE LA ESPERANZA Y LA VARIANZA DE UNA VARIABLE


ALEATORIA

1) E (c ) = c ; V(c) = 0

2) E ( c X ) = c E ( X ) ; V ( c X ) = c2 V ( X )

3) E (a + b X ) = a + b E ( X ) ; V ( a + b X ) = b2 V ( X )

PROPIEDADES DE LA SUMA O DIFERENCIA DE DOS VARIABLES ALEATORIAS

Recordemos que dos eventos A y B son independientes si P( A | B ) = P( A )


Extendiendo esta idea, definimos que las variables aleatorias discretas X ,Y son independientes si

Para cualquier xi , yj , P( Y = yj ) | X = xi ) = P( Y = yj )

1) Si X, Y son dos variables aleatorias con esperanzas E(X) y E(Y), entonces la esperanza de una
suma (diferencia) de X, Y es la suma (diferencia) de las esperanzas respectivas. Esto es,

E(X Y) = E(X)  E(Y)

2) Si X, Y son variables aleatorias independientes entonces

V(X Y) = V(X) + V(Y)

Ejemplo 3.8
78
Para el ejemplo 3.6 considere las siguientes situaciones:
1) Si el comerciante le ofrece al vendedor una comisión de C$ 500 por computador vendido
determine:
i) El ingreso semanal esperado del vendedor.
ii) La desviación estándar del ingreso semanal. Interprete los resultados.

Hagamos que la variable aleatoria Y represente al ingreso semanal del vendedor.

Entonces Y = 500X

Aplicando las propiedades de la esperanza y la varianza y recordando del ejemplo 3 que


E (X ) = 2 computadoras y que σ X = 1 computadora tenemos que:

i) E ( Y ) = 500 E ( X ) = 500 ( 2 ) = C$ 1000


ii) V ( Y ) = 5002V ( X ) = 5002 ( 1 ) = 5002 Y = 5002 = C$ 500
Por tanto a medida que transcurran las semanas, el vendedor espera tener un ingreso semanal promedio
de C$ 1000 y su ingreso semanal variará la mayor parte de las veces entre C$ 500 y C$ 1500.

2) Si el comerciante le ofrece al vendedor pagarle C$ 800 fijos por semana más C$ 400 por
computador vendidor, determine:

i) El ingreso semanal promedio del vendedor.


ii) La desviación estándar del ingreso semanal
Interprete los resultados

Hagamos que Y represente el ingreso semanal del vendedor

Entonces Y = 800 + 400X

 Y = E ( Y ) = E ( 800 + 400X ) = 800 + 400 E ( X )

= 800 + 400 ( 2 ) = C$ 1600

V ( Y ) = V ( 800 + 400X ) = 4002 V ( X ) = 4002 ( 1 ) = 4002

Y= 4002 = C$ 400

¿Cómo interpretaría usted estos resultados?


79
3.5 MODELOS PROBABILISTICOS
OBJETIVOS.

INTRODUCCION
Hay situaciones en las cuales el cumplimiento de ciertas condiciones experimentales nos lleva a
utilizar lo que llamaremos un modelo probabilístico, esto es, una distribución de probabilidad de una
variable aleatoria definida por una expresión matemática
Estos modelos tendrán un nombre y serán estudiados en esta tema.
Para poder comprender estas expresiones matemáticas necesitaremos estudiar los siguientes
conceptos:

COMBINACIONES

EL FACTORIAL DE UN NUMERO
Sea n un número natural.
El factorial de n se denota y define así

n! = n ( n – 1 ) (n – 2 ) . . . . . . 1

Nota: 0! = 1

De manera que:

1! = 1
2! = 2 (1) = 2
3! = 3 (2) (1) = 6
4! = 4 (3) (2) (1) = 24

NUMERO DE COMBINACIONES DE x OBJETOS TOMADOS DE n

El número de combinaciones de x objetos tomados de n se denota y define así

n n!
  =
x x! ( n - x )!

Para las siguientes situaciones tendremos que:

n n n


  = 1 ,   = n ,   = 1
n 1  o 
También podemos utilizar la siguiente fórmula simplificada

n n ( n - 1 )  ( n - x + 1 )
  = donde (n – x + 1 ) es el último factor
x  x!
80
De manera que

8 8! 8(7)(6) 5! 8(7)(6)


  = = = = 56
 3  3! 5! 3(2)(1) 5! 3(2)(1)

Con la fórmula simplificada tendremos que

 8  8(7)(6)
  = = 56 porque 8 – 3 + 1 = 6 es el último factor
 3  3(2)(1)

Para situaciones como las siguientes, escribiremos sin ningún cálculo

 5 10   4
  = 1 ,   = 10 ,   = 1
 5 1  0

calculemos ahora
15  15(14)(13)(12)(11)(10)(9)
  = = 6435
7  7(6)(5)(4)(3)(2)(1)

3.5.1 DISTRIBUCION BINOMIAL

La distribución binomial es una distribución de probabilidad de una variable aleatoria discreta, que
será aplicable cada vez que se suponga un proceso de Bernoulli.

PROCESO DE BERNOULLI
Es un proceso de muestreo, esto es, una muestra de tamaño n que resulta de repetir un mismo
experimento aleatorio  (que llamaremos ensayo) n veces y que cumple las siguientes condiciones:

1) Los resultados posibles de cada ensayo pueden clasificarse en dos eventos E y F mutuamente
excluyentes y exhaustivos (posteriormente serán llamados éxito y fracaso respectivamente).

2) Las probabilidades de (E) y (F) permanecen constantes en todos los ensayos, es decir, el proceso
es estacionario.

3) Cualquier serie de eventos E y F obtenidos de los n ensayos constituyen eventos independientes.

EL MODELO BINOMIAL
Supongamos que estamos ante un proceso de Bernoulli con n ensayos donde uno de los dos eventos
será el éxito y la probabilidad de que ocurra un éxito se representará por p.
Estaremos interesados en una variable aleatoria X que representará el número de éxitos en la muestra,
donde el objetivo principal será obtener una expresión matemática que defina a la distribución de
probabilidad de X
81
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución binomial con parámetros n y p , o modelo binomial con parámetros n y p.

n
P ( X = x ) =   p x ( 1 - p ) n - x , x = 0, 1, 2, , n
x 

donde x es un valor particular de X


y 1 – p representa la probabilidad de un fracaso.

CARACTERISTICAS.

1. Cada vez que se especifica un grupo de parámetros n y p se produce una distribución binomial
particular.

2. La distribución es simétrica si p = 0.50

La distribución es asimétrica a la derecha si p  0.50 y a la izquierda si p  0.50. Cuando n crece y


p se acerca a 0.50 la asimetría tiende a disminuir.

3. La esperanza de X se obtiene así

μ x = E ( X) = np

4. La varianza de X se obtiene así

V(X) = np(1–p)

Ejemplo 3.9
En un archivo hay 5 documentos de la empresa A y 15 documentos de la empresa B. Seleccionar al
azar y con reposición 4 documentos anotando la empresa correspondiente de cada uno.

Determine la probabilidad de que 3 sean de la empresa B.

Proceso de Bernoulli.
Población finita de tamaño N = 20
Aquí existe un proceso de muestreo que resulta de repetir el ensayo  : seleccionar al azar y con
reposición un documento, n = 4 veces. Miremos ahora que condiciones cumple:

1. Cada ensayo tiene dos eventos mutuamente excluyentes y exhautivos:

A representa “es de la empresa A”


B representa “es de la empresa B”

2. Las probabilidades de A y B permanecen constantes en el proceso porque las selecciones de los


documentos se realizaron con reposición de una población finita.
82
3. Además cualquier serie de eventos A y B, obtenidos de los 4 ensayos, constituyen eventos
independientes.

Luego hay un proceso de Bernoulli con n = 4 ensayos.

El modelo Binomial
Observe para el proceso anterior que n = 4 ensayos, que el evento B ( es de la empresa B) será el
éxito, y la probabilidad de que ocurra un éxito será p = P( B ) = 15 / 20 = 0.75
La variable aleatoria X representará el número de documentos de la empresa B en la muestra.
La probabilidad de que X = 3 se obtiene aplicando un modelo binomial con parámetros n = 4 y
p = 0.75

 4
P( X = 3 ) =   (0.75)3 (0.25) = 4(0.4219)(0.25) = 0.4219
 3

Ejemplo 3.10
Debidos a las altas tasas de interés, una firma informa que 30% de sus cuentas por cobrar de otras
firmas comerciales están vencidas. Un contador escoge aleatoriamente una muestra de 5 cuentas.

1. Obtenga la expresión matemática que define a la distribución de probabilidad del número de


cuentas vencidas.

Proceso de Bernoulli.
Población muy grande (infinita)
Aquí existe un proceso de muestreo que resulta de repetir el ensayo  : escoger aleatoriamente una
cuenta por cobrar, n = 5 veces. Miremos ahora que condiciones cumple:

1. Cada ensayo tiene dos eventos mutuamente excluyentes y exhaustivos:

V representa “está vencida”


V’ representa “ no esta vencida”

2. Las probabilidades V y V’ permanecen constantes en el proceso porque las escogencias de las


cuentas se realizaron sin reposición de una población considerada infinita.

3. Además cualquier serie de eventos V y V’, obtenidos de los 5 ensayos, constituyen eventos
independientes.

Luego hay un proceso de Bernoulli con n = 5 ensayos.

Aplicando el modelo Binomial.


Observe para el proceso anterior con n = 5 ensayos, que el evento V será el éxito, y la probabilidad
de que ocurra un éxito será p = P( V ) = 0.30.
La variable aleatoria X representará el número de cuentas vencidas en la muestra
La expresión matemática que definirá a la distribución de probabilidad de X será la correspondiente
a un modelo binomial con parámetros n = 5 y p = 0.30.
83
Esto es,

5 
P ( X = x ) =   ( 0.30 )x ( 0.70 )5 - x , x = 0, 1, 2, , n
x

2. Determine la probabilidad de que:

a) 2 cuentas estén vencidas

5
P(X=2) =   ( 0.30 ) 2 ( 0.70 ) 3 = 10 ( 0.09 ) ( 0.343 ) = 0.3087
 2

b) ninguna este vencida

5
P (X=0) =   ( 0.30 )0 ( 0.70 )5 = ( 1 ) ( 1 ) ( 0.1681 ) = 0.1681
0

c) al menos una este vencida

P(X1) = 1 - P(X=0)
= 1 - 0.1681 = 0.8319

d) todas esten vencidas

5
P (X =5) =   ( 0.30 )5 ( 0.70 )0 = ( 1 ) ( 0.0024 ) ( 1 ) = 0.0024
5

Ejemplo 3.11
La probabilidad de que un presunto cliente de un centro comercial escogido aleatoriamente haga una
compra es 0.20. Un vendedor visita a 15 presuntos clientes.

1. Determine la probabilidad de que:

a) Haga menos de 3 ventas.

Puede verificarse la existencia de un proceso de Bernoulli con n = 15 ensayos, y por tanto,


aplicarse un modelo binomial
Observe que el evento V ( hacer una venta ) será el éxito y que la probabilidad de que ocurra un éxito
será p = P( V ) = 0.20
84
La variable aleatoria X representará el número de ventas realizadas en la muestra y

P(X3) = P(X  2) = P(X = 0) + P(X = 1) + P(X = 2)

se obtiene aplicando un modelo binomial con parámetros n = 15 y p = 0.20

15 
P ( X = 0) =   ( 0.20 )0 ( 0.80 )15 = ( 1 ) ( 1 ) ( 0.0352 ) = 0.0352
 0

15 
P ( X = 1) =   ( 0.20 )1 ( 0.80 )14 = 15 ( 0.20 ) ( 0.0440 ) = 0.1319
 1

15 
P ( X = 2) =   ( 0.20 )2 ( 0.80 )13 = 105 ( 0.04 ) ( 0.0550 ) = 0.2309
 2

Luego P ( X  3 ) = 0.0352 + 0.1319 + 0.2309 = 0.3980

b) Haga al menos 3 ventas.

P(X  3) = 1 - [P(X = 0) + P(X = 1) + P(X = 2 )]

= 1 - 0.3980 = 0.602

2. Determine el número esperado de ventas del vendedor y la desviación estándar del número de
ventas.

E ( X ) = np = 15 ( 0.20 ) = 3 ventas

V ( X ) = np ( 1 – p ) = 15 ( 0.20) ( 0.80 ) = 2.4  X = 2.4 = 1.5492 ventas

Interpretar el resultado
85
3.5.2 DISTRIBUCION HIPERGEOMETRICA

Cuando estamos ante un proceso de muestreo con n ensayos que sólo cumple la primera condición
del proceso de Bernoulli, significa que cada elemento se seleccionó sin reposición de una población
finita de tamaño N, lo cual provocó un cambio sistemático en la probabilidad de un éxito y un fracaso
a medida que se retiraron los elementos de la población. De manera que ahora no estaremos ante un
proceso de Bernoulli, pero será de interés una variable aleatoria X que representará el número de
éxitos en la muestra.

EL MODELO HIPERGEOMETRICO
Puede demostrarse que la siguiente expresión matemática define una distribución de probabilidad de
X llamada distribución hipergeométrica con parámetros n, N y A, o modelo hipergeométrico con
parámetros n, N y A.

A  N-A 
   
P(X = x) = x   n-x  , x = 0, 1, 2, , n
 N
 
n 
donde

N representa el número de elementos en la población


A representa el número de éxitos en la población
N – A representa el número de fracasos en la población
n representa el número de elementos en la muestra
x representa el número de éxitos en la muestra
n – x representa el número de fracasos en la muestra

CARACTERISTICAS.
A
Hagamos que p = represente la proporción de éxitos en la población y que 1 – p representa
N
la proporción de fracasos en la población.

1. Cada vez que se especifica un grupo de parámetros n, N, A se produce una distribución


hipergeométrica particular.

2. La distribución es simétrica si p = 0.50 y asimétrica cuando P  0.50


La distribución es asimétrica a la derecha si p  0.50 y a la izquierda si p  0.50.
Cuando n crece y p se acerca a 0.50 la asimetría tiende a disminuir.

3. La esperanza de X se obtiene así


x = E (X) = np
86
4. La varianza de X se obtiene así

 N -n 
V(X) = np( 1 - p )  
 N - 1 

Lo cuál implica que  X = V(x)

Ejemplo 3.12
Un gerente selecciona aleatoriamente 3 individuos de un grupo de 10 empleados para asignarlos a un
estudio de clasificación de salarios. Suponga que 4 de los empleados trabajaron previamente en
proyectos semejantes.

1. Determine la expresión matemática que define a la distribución de probabilidad del número de


empleados con experiencia.

Este es un proceso con n = 3 ensayos, que sólo cumple la primera condición de un proceso de
Bernoulli porque los 3 empleados se seleccionaron al azar sin reposición de una población finita
de tamaño N = 10.
Observe que el evento E (con experiencia) será el éxito y que por tanto tendremos que:

N representa el número de empleados del grupo.


A representa el número de empleados con experiencia.
N – A representa el número de empleados sin experiencia.
n representa el número de empleados en la muestra.
x representa el número de empleados con experiencia en la muestra.
n – x representa el número de empleados sin experiencia en la muestras.

La variable aleatoria X representará el número de empleados con experiencia, y la expresión


matemática que va a definir a la distribución de probabilidad de X, será la correspondiente a un modelo
hipergeométrico con parámetros n = 3, N = 10 y A = 4.
Esto es,
4 6 
   
P(X = x) =    
x 3-x
, x = 0, 1, 2, 3
10 
 
3 

2. Determine la probabilidad de que:


a) dos tengan experiencia.

 4  6   4  6
       
 2 3 - 2  2  1  6(6)
P(X = 2) = = = = 0.30
10  10  120
   
3  3 
87
b) ninguno tenga experiencia.

 4  6   4  6
       
 0   3 - 0 
=    
0 3 ( 1 ) (20 )
P(X = 0) = = = 0.1667
10  10  120
   
3  3 

c) a lo sumo 2 tienen experiencia

P(X  2) = P(X = 0) + P(X = 1) + P(X = 2)

 4 6
   
P(X = 1) = 1   2  =
4 ( 15 )
= 0.50
10  120
 
3 

Luego P ( X  2 ) = 0.1667 + 0.5000 + 0.3000 = 0.9667

3. Determine el número esperado de empleados con experiencia y la desviación estándar del número
de empleados con experiencia.

A 4
Como p = = = 0.4
N 10

E( X ) = np = 3(0.4) = 1.20 empleados

 N-n
V( X ) = np (1 – p)   = 3(0.4)(0.6)( 7 / 9 ) = 0.56   X = 0.56 = 0.7483 empleados
 N -1 

LA DISTRIBUCION BINOMIAL COMO UNA APROXIMACION A LA DISTRIBUCION


HIPERGEOMETRICA.
Cuando el tamaño N de la población se considera muy grande en comparación al tamaño n de la
muestra, el hecho de que el muestreo se efectúe sin reposición tiene poco efecto en la probabilidad de
éxito de cada ensayo.
Un método empírico conveniente es que se puede utilizar una distribución binomial con parámetros n
A
y p = como una aproximación de la distribución hipergeométrica cuando n  0.05 N, esto
N
es, el tamaño de la muestra debe ser menor que el 5% del tamaño de la población.
88
Ejemplo 3.13
Recordemos el ejemplo 1.1, donde se quiere conocer la situación socioeconómica de un sector de
Managua. Supongamos que el sector tiene 1000 familias de las cuales 600 tienen trabajo formal. El
responsable de la investigación quiere saber, ¿cuál es la probabilidad de que al seleccionar azar 5
familias a lo sumo una tenga trabajo formal?

Aquí hay un proceso de muestreo con n = 5 ensayos que sólo cumple la primera condición de un
proceso de Bernoulli porque el muestreo se hace sin reposición de una población finita.

Observe que el evento F (tiene trabajo formal) es el éxito y que por tanto tendremos que:
N : representa el número de familias en el sector.
A : representa el número de familias con trabajo formal.
n : representa el número de familias en la muestra.
x : representa el número de familias con trabajo formal en la muestra.

Como la variable aleatoria X representa el número de familias con trabajo formal en la muestra
Entonces la distribución de probabilidad de X será la distribución hipergeométrica con n = 5 , N
= 1000 y A = 600.

P (a lo sumo una tenga trabajo formal) = P ( X  1 ) = P ( X = 0 ) + P(X = 1)

Miremos ahora la posibilidad de utilizar la distribución binomial como una aproximación de la


hipergeométrica.

n 5
= = 0.005  n = 0.005 N
N 1000
Esto es, el tamaño de la muestra es el 0.5% del tamaño de la población. Luego se cumple la relación
empírica de que n  0.05 N. Podemos utilizar una distribución binomial con parámetros n = 5
A 600
y p= = = 0.60 como una aproximación de la distribución hipergeométrica con
N 1000
parámetros n = 5, N = 1000 y A = 600.

5
P ( X = 0 ) =   ( 0.60 ) 0 ( 0.40 ) 5 = ( 1 ) ( 1 ) ( 0.0102 ) = 0.0102
 0

 5
P ( X = 1 ) =   ( 0.60 ) 1 ( 0.40 ) 4 = 5 ( 0.60 ) ( 0.0256 ) = 0.0768
1 

P ( X  1 ) = 0.0102 + 0.0768 = 0. 0870


89
3.5.3 DISTRIBUCION DE POISSON
Ahora estudiaremos un proceso semejante al proceso de Bernoulli en el cual los eventos ocurrirán en
una porción muy pequeña que generalmente será de tiempo.

PROCESO DE POISSON.

Consideremos una unidad t de tiempo, longitud, superficie, volumen, etc. dividida en porciones t
muy pequeñas. Un proceso de muestreo resultante de la posible repetición de un mismo experimento
aleatorio  ( que llamaremos ensayo y cuyos resultados posibles serán llamados observaciones en la
porción t ) será un proceso de Poisson si cumple las siguientes condiciones:

1) Las observaciones en cada porción t pueden clasificarse en dos eventos E y F mutuamente


excluyentes y exhaustivos que llamaremos éxito y fracaso respectivamente.

2) La probabilidad de que se produzca un éxito ( E ) es muy pequeño y permanece constante en cada


porción t. La probabilidad de que se produzan dos o más éxitos en una porción t es tan reducida
que podemos asignarle un valor cero.

3) La ocurrencia de un éxito ( E ) en la porción t es independiente dela ocurrencia de otro éxito


( E ) en cualquier otra porción t.

EL MODELO DE POISSON
En un proceso de Poisson estaremos interesados en una variable aleatoria X que representará el
número de éxitos en la unidad de tiempo, superficie, volumen, etc. Supongamos que  (lambda)
representa el número promedio de éxitos en la unidad de tiempo, superficie, volumen, etc, y que este
valor se conoce por experiencia.
Entonces la distribución de probabilidad de X definida por la siguiente expresión matemática, será
la distribución de Poisson con parámetros  , o simplemente el modelo de Poisson con parámetro .

 x e- 
P( X = x ) = , x = 0, 1, 2, 
x!
e = 2.71828 

CARACTERISTICAS.

Cada vez que se especifica el parámetro  se produce una distribuciónde Poisson particular.

La distribución es siempre asimétrica a la derecha cuando  es pequeña y se acercará a la simetría


(con su punto más alto en el centro) según aumenta .

La esperanza de X se obtiene así

μ X = E(X) = λ

La varianza de X se obtiene así V(X) =   σx = λ


90
Ejemplo 3.14
Suponga que el número promedio de vehículos que llegan a un parqueo es de 10 por hora.
¿ Cuál es la probabilidad de qué en una hora determinada lleguen 4 vehículos ?

Verificando la existencia de un proceso de Poisson.


Consideremos la unidad de tiempo, una hora, dividida en porciones muy pequeñas de tiempo, digamos
en segundos.

1) En cada segundo pueden observarse dos eventos mutuamente excluyentes y exhaustivos:

E : llega un vehículo.
F : no llega ninguno vehículo. Suponga que E es el éxito y F el fracaso.

2) La probabilidad de que llegue un vehículo en un segundo es muy pequeña y permanecerá


constante en cada segundo. Además la probabilidad de que lleguen 2 o más vehículos en un
segundo es casi cero.

3) La llegada de un vehículo en un segundo es independiente de la llegada de otro vehículo en


cualquier otro segundo.

Por lo tanto estamos ante un proceso de Poisson.

Aplicando el modelo de Poisson.


En el proceso anterior tendremos que:
X que representará el número de vehículos que llegan en una hora.
 representará el número promedio de vehículos que llegan en una hora.
Sabemos por experiencia que  = 10 y que la probabilidad de que X = 4 se va a obtener aplicando
un modelo de Poisson con parámetro  = 10

−10
104 e 10000(0.00004540) 0.4540
P( X = 4 ) = = = = 0.0189
4! 24 24
Ejemplo 3.15
Suponga que el número promedio de llamadas que llegan a una Central Telefónica es de 120 por hora.
1) Construya la expresión matemática que define a la distribución de probabilidad del número de
llamadas que ocurren en 3 minutos.

Podemos verificar la existencia de un proceso de Poisson.


En este proceso tendremos que:
X representará el número de llamadas que ocurren en 3 minutos.
 representará el número promediode llamadas que ocurren en 3 minutos.

Entonces la expresión matemática que va a definir a la distribución de probabilidad de X, será la


120
correspondiente a un modelo de Poisson con parámetro  = ( ) ( 3 ) = 2(3) = 6
60
Esto es,
6x e- 6
P(X = x) = , x = 0, 1, 2, 
x!
2) ¿Cuál es la probabilidad de que:
91

i) Se reciban 2 llamadas
6 2 e- 6
P(X = 2) = = 18 e- 6 = 18 ( 0.0025 ) = 0.0450
2!

ii) Se reciba una llamada o más

P(X  1) = 1 - P(X = 0)

60 e - 6 ( 1 ) e- 6
P(X = 0) = = = e- 6 = 0.0025
0! 1

P ( X  1 ) = 1 - 0.0025 = 0.9975

Ejemplo 3.16
En una fábrica han ocurrido accidentes a razón de una cada dos meses. Suponga que ocurrieron en
forma independiente.

1. Determine la probabilidad de que:


i) No haya accidente en determinado mes.

Tenemos un proceso de Poisson en el cual.


X representará el número de accidentes que ocurren cada mes.
 representara el número promedio de accidentes por mes.

1
Entonces vamos a utilizar un modelo de Poisson con  = = 0.50 accidentes por mes
2
(0.5)0 e − 0.5 (1)e− 0.5
P( X = 0 ) = = = e − 0.5 = 0.6065
0! 1

ii) hayan 4 accidentes en determinado trimestre


1
Utilizaremos un modelo de Poisson con  = (3) = 1.5 accidentes
2
( 1.5 )4 e- 1.5 5.0625 ( 0.231 )
P(X = 4) = = = 0.0471
4! 24

2. ¿Cuantos accidentes espero en un año?

1
 = ( 12 ) = 6 accidentes
2
92
LA DISTRIBUCION DE POISSON COMO UNA APROXIMACION DE LA
DISTRIBUCION BINOMIAL
Cuando en una distribución binomial n es grande y p es pequeño, los cálculos son bastante tediosos.
Afortunadamente podemos utilizar el modelo de Poisson como una aproximación del modelo
binomial haciendo  = np. Una regla empírica conveniente es que tal aproximación se puede hacer
cuando n  20 y p  0.05.

Ejemplo 3.17
Se sabe que el 1% de las cuentas de ahorro de un banco están desactivadas. Se selecciona
aleatoriamente una muestra de 30 cuentas.
¿Cuál es la probabilidad de que 3 cuentas esten desactivadas?

Podríamos utilizar una distribución binomial con n = 30 y p = 0.01, pero como se cumple la regla
empírica podemos usar la distribución de Poisson con  = 30 ( 0.01 ) = 0.30

3 - 0.3
( 0.30 ) e 0.027 (0.7408 )
P(X = 3) = = = 0.0033
3! 6

Si hubieramos utilizado la distribución binomial con n = 30 y p = 0.01 tendriamos que

 30 
P(X = 3) =  (0.01)3 (0.99)27 = 4060(0.000001)(0.7623) = 0.0031
3 

De esta manera la diferencia entre la aproximación de Poisson y el valor de probabilidad binomial


real es 0.0002.
93
EJERCICIOS PROPUESTOS
1. Al director de una empresa de entrega de correspondencia, le preocupa el número de cartas
extraviadas por su firma. Para analizar la situación ha recabado la siguiente información durante los
últimos 16 meses:
N°cartas N°meses
5 2
6 4
7 6
8 3
9 1

a) Si la variable aleatoria X representa el número de cartas extraviadas por mes, construya la


distribución de probabilidad de X y grafíquela.
b) ¿Cuál es la probabilidad de que en un mes determinado se extravíen menos de dos cartas?
c) Calcule el número esperado de cartas extraviadas por mes y la desviación estándar, interprete las
respuestas.

2. El número de accidentes de tránsito registrados por la Policía de Tránsito durante 40 días feriados
se presentan a continuación:
N°accidentes N°días

0 15
1 10
2 8
3 7

40
Si la variable aleatoria X representa el número de accidentes de tránsito:
a) Construya la distribución de probabilidad de X y trace la grafica.
b) ¿Cuál es la probabilidad de que en cierto día haya a lo sumo 1 accidente?
c) Calcule el valor esperado de accidentes.
d) Calcule la desviación estándar del número de accidentes (interprete el resultado).

3. En la siguiente tabla se muestra el número de camionetas que se han solicitado por día a, una
agencia que renta vehículos, en un período de 50 días.

No. Camionetas No. días

3 10
4 16
5 18
6 4
7 2

50

Si X representa el número de camionetas solicitadas por día.

i) Construya la distribución de probabilidad de X y grafíquela.


94
ii) ¿Cuál es la probabilidad de que cierto día se solicitan entre 4 y 6 camionetas (incluyendo a 4
y 6)
iii) ¿Cuántas camionetas espero que sean solicitadas en un día?
iv) ¿ Calcule la desviación estándar de X e interprete el resultado

4. El número de revistas vendidas por día en una tienda durante 30 días se presenta en la siguiente
tabla.

No. Revistas No. días

10 3
11 7
12 10
13 8
14 2

30
Si X representa el número de revistas vendidas por día.

i) Construya la distribución de probabilidad de X y grafíquela.


ii) ¿Cuál es la probabilidad de que cierto día se vendan como máximo 12 revistas.
iii) ¿Cuántas revistas espero vender en un día? Interprete el resultado.
iv) Calcule la desviación estándar de X e interprete el resultado.

5. Julio Martínez recibe un lote de 100 discos de clutch.


El historial de la empresa muestra que el 10% de discos recibidos es defectuoso.
Saquemos al azar 2 discos uno a uno de dicho lote (sin reposición) y anotemos el número de discos
defectuosos. Si la variable aleatoria X representa el número de discos defectuosos en la muestra.

a) Construya una distribución de probabilidad de X.


b) Determine la esperanza y varianza de X. Interprete el resultado.

6. Un inversionista ha decidido invertir su dinero en dos acciones diferentes. En su búsqueda ha


encontrado que tiene como alternativas, cinco acciones, de las cuales 2 son preferentes y 3 son
ordinarias. Si la variable aleatoria X representa el número de acciones preferentes que comprará y
decide seleccionarlas al azar.
a) Construya la distribución de probabilidad de X y grafíquela.
b) Elabore la función de distribución acumulada y grafíquela.

7. Sea X la variable aleatoria que muestra el número de niñas en las familias de 2 hijos.
¿Cuál el la distribución de probabilidad de X si los nacimientos de varones y de niñas son
igualmente probables?

8. De 12 cuentas de un archivo, 4 contienen un error de procedimiento al contabilizar los saldos de


las cuentas.
Un auditor selecciona aleatoriamente dos de estas cuentas (sin reposición). Si X representa el número
de cuentas con error de procedimiento en la muestra.
a) Construya la distribución de probabilidad de X y grafíquela.
b) Construya la función de distribución acumulada de X y grafíquela.
95
9. Un vendedor de paraguas gana C$ 30 en días de lluvias; cuando hay días soleados (no lluvia) pierde
C$ 6. La probabilidad de que un día sea lluvioso es de 40% ¿Que ganancia espera tener por día a
largo plazo?

10. En una empresa de negocios una persona puede obtener ganancias diarias de $ 300 con una
probabilidad 0.6 o experimentar una pérdida de $ 100 con probabilidad de 0.4.
¿Qué ganancia espera tener por día a largo plazo?

11. Se tienen dos granjas para la siembra de cierto cultivo. Se calcula que en la primera granja el
cultivo en cuestión producirá una utilidad anual de $ 20,000 si tiene éxito, y una pérdida anual de $
2,000 si no lo tiene.
Se estima también que en la segunda granja el cultivo producirá una utilidad anual de $ 25,000 si tiene
éxito, y una perdida anual de $ 5,000 si no lo tiene. Si la probabilidad de éxito en cada granja es ½.
¿En qué granja se debe sembrar el cultivo con el fin de elevar al máximo las utilidades esperadas?
¿Como se afectaría la decisión si la probabilidad fuera ¼ en vez de ½ ?

12. Si la probabilidad de que, en un momento dado, el precio del barril de petróleo en el Mercado
Mundial se mantenga constante es 0.46; las probabilidades de que el precio aumente $ 0.50 ó $ 1.00
son respectivamente 0.17 y 0.23 y la probabilidad de que el precio disminuya $ 0.25 es 0.14, ¿Cuál
es el aumento esperado en el precio del barril de petróleo?

13. Un concesionario de un estadio de béisbol tiene que elegir entre trabajar detrás del mostrador de
venta de salchichas y recibir una suma fija de C$ 50 por noche, o caminar entre las gradas
vendiendo cerveza a comisión. Si elige esto último, puede obtener C$90 en una noche cálida, C$70
en una noche moderada, C$45 en una noche fresca y C$15 en una noche fría. En esta época del año
las probabilidades de que las noches sean cálidas, moderadas, frescas y frías son, respectivamente,
0.1, 0.3, 0.4 y 0.2
a) Determinar el valor esperado a ganar vendiendo cerveza esta noche.
b) ¿Qué producto debe vender el empleado? ¿Por qué?

14. La probabilidad de que una casa de cierto tipo sea destruida por incendio en un periodo
cualquiera de doce meses es de 0.005. Una compañía de seguros ofrece en venta al dueño de esa
casa una póliza de seguro contra incendio por el término de un año de 20000 córdobas con una
prima de 150 córdobas. ¿Cuál es la ganancia esperada de la compañía?

15. Un vendedor ambulante, tiene que determinar si vende hoy refrescos o helados, pues considera
que la utilidad que realice dependerá del clima. La tabla de rendimientos es la siguiente.
Estrategia
Evento vender refrescos vender helados

Clima fresco 40 20
Clima cálido 55 80

En base a su experiencia anterior en esta época del año, el vendedor estima que la probabilidad de
clima cálido es 0.60
Determinar si el vendedor debe vender refrescos o helados.

16. Un vendedor ha descubierto que las probabilidades del número de ventas por día, se presentan
de la siguiente manera:
96

No. Ventas Probabilidad

1 0.19
2 0.45
3 0.29
4 0.07

Si el vendedor obtiene una comisión de C$ 150 por venta determine:

i) La ganancia diaria esperada del vendedor después de muchos días.


ii) La desviación estándar de la ganancia diaria. Interpretar el resultado

17. Un agente de ventas ha recibido una oferta de trabajo de una casa comercial que distribuye cocinas
eléctricas.
Suponga que X es la variable aleatoria que representa el número de cocinas vendidas en una semana
y que la distribución de probabilidad de esas ventas es.

x1 f ( xi )

0 0.30
1 0.35
2 0.25
3 0.10

Si la casa comercial ofrece al agente de ventas pagarle C$ 500 fijos por semana, más C$ 300 por cada
cocina que venda, determine.
a) El ingreso semanal esperado del agente de ventas después de muchas semanas.
b) La desviación estándar del ingreso semanal del agente. Interpretar el resultado.

18. Suponga que la producción semanal de cierto artículo que elabora una empresa es una variable
aleatoria cuya distribución de probabilidad es la siguiente.

N° artículos Probabilidad

1000 0.35
2000 0.25
3000 0.30
4000 0.10

Suponiendo costos fijos semanales de la empresa de C$3000 y costos unitarios de producción de


C$40 determine.
a) El costo total esperado de una producción semanal de la empresa después que hayan transcurrido
muchas semanas.
b) La desviación estándar del costo total de una producción semanal de la empresa.
19. El número de días requeridos para completar un proyecto publicitario es una variable aleatoria X
con distribución de probabilidad:
97

x 10 11 12 13 14
P(x) 0,2 0,3 0,3 0,1 0,1

El beneficio en dólares obtenido por la empresa está dado por la siguiente función:

Y = 200.000 (12 – X)

a) ¿Cuál es el beneficio esperado por la empresa, en este proyecto?


b) ¿Cuál es la probabilidad de que el proyecto le produzca pérdida a la empresa?
c) Calcule la desviación estándar de la variable aleatoria Y.

20. Suponga que el 40% de los empleados de una gran firma están a favor de la representación
sindical, y que se pide una respuesta anónima a una muestra aleatoria de 10 empleados.
1. Obtenga la expresión matemática que define la distribución de probabilidad del número de
empleados a favor de la representación sindical.
2. ¿Cuál es la probabilidad de que:
a) Ninguno este a favor de la representación Sindical.
b) Todos estén a favor de la representación Sindical.
c) Menos de la mitad estén a favor de la representación Sindical.

21. Un estudio realizado en cierta universidad con el propósito de dar seguimiento al grado de
aceptación por el mercado laboral de sus graduados muestra que el 70% de los graduados obtienen
empleo en su área de elección después de un año de graduación. Si se elige una muestra aleatoria de
cinco graduados de esa universidad, ¿Cuál es la probabilidad de que:
a) Ninguno haya encontrado trabajo después de un año de graduado?
b) Dos o más hayan encontrado trabajo después de un año de graduados?
c) Calcule la esperanza y la desviación estándar del número de graduados que hayan encontrado
trabajo después de un año de graduados.

22. La probabilidad de que un posible cliente haga una compra cuando un vendedor se comunique
con él es 0.40. Si un vendedor selecciona aleatoriamente de un archivo 3 posibles clientes y se
comunica con ellos.
1. ¿Cuál es la probabilidad de que el vendedor haga
a) 3 ventas
b) por lo menos 2 ventas
2. ¿Cuántas ventas espero que haga el vendedor a largo plazo?
3. Calcule la desviación estándar del número de ventas.

23. La probabilidad de que un empleado elegido al azar este participando en un programa de inversión
en acciones de una compañía es 0.30. Si se eligen al azar 5 empleados.
¿Cuál es la probabilidad de que el número de participantes sea
a) Exactamente 3 empleados?
b) Menos de 3 empleados?
c) Por lo menos 4 empleados?

24. Suponga que Usted va a tener un examen de 10 preguntas de verdadero- falso y tiene que adivinar
en cada pregunta.
1) Calcule la probabilidad de que:
98
a) tenga 6 preguntas correctas
b) tenga 7 u 8 preguntas correctas
c) tenga por lo menos 9 preguntas correctas.
2) Calcule la probabilidad de aprobar el examen si para pasarlo tiene que tener correctas por lo menos
6 preguntas.
3) ¿Cuántas preguntas correctas espera contestar?

25. Un gerente de un banco sabe por experiencia que, en promedio, el 10% de los clientes de préstamos
fallan en sus pagos. Un día el gerente autoriza 7 préstamos.
1. ¿Cuál es la probabilidad de que:
a) Ninguno falle en sus pagos?
b) Uno falle en sus pagos?
c) Al menos dos fallen en sus pagos?
2. ¿Cuántos clientes espero que fallen en sus pagos después de muchas autorizaciones de ese
tipo.
3. Calcule la desviación estándar del número de clientes que fallan en sus pagos.

26. Con base en la experiencia anterior, el 15% de las facturas de una compañía que vende libros
por correo están incorrectas. Si se selecciona una muestra aleatoria de 3 facturas actuales,
1. Obtenga la expresión matemática que define la distribución de probabilidad del número de
facturas incorrectas.
2. ¿Cuál es la probabilidad de que:
a) dos facturas estén incorrectas?
b) No más de dos facturas estén incorrectas?

27. Los registros de servicios señalan que el 50% de automóviles nuevos de una sola marca
requerirán algún tipo de reparación durante el periodo de garantía de 90 días. Para una muestra
aleatoria de 12 automóviles nuevos determine la probabilidad de que durante el periodo de garantía
requieran reparaciones.
a) ocho o nueve
b) no más de 2

28. El fabricante de unidades de disco de una muy conocida marca de computadoras, espera que sólo
el 2% de esas unidades tengan problemas de funcionamiento durante el periodo de garantía de la
computadora.
En una muestra de 10 unidades de discos, ¿cuál es la probabilidad de que
a) ninguna tenga problemas de operación durante el periodo de garantía?
b) exactamente una funcionará mal durante este periodo?
c) por lo menos dos tendrán problemas de operación?

29. El gerente de un restaurante que sólo da servicio mediante reservas sabe, por experiencia, que
el 20% de las personas que reservan una mesa no asistirán.
Si el restaurante acepta 25 reservas pero sólo dispone de 20 mesas, ¿cuál es la probabilidad de que a
todas las personas que asistan al restaurante se les asigne una mesa?

30. Según una empresa, el 40% de los automóviles que circulan en la ciudad de
Managua contaminan el ambiente emanando más cantidad de monóxido de carbono del permitido.
99
Una comisión Municipal examina 10 automóviles, ¿Cuál es la probabilidad de que encuentre por lo
menos dos infractores?

31. El propietario de un Cyber Café ha adquirido 10 máquinas computadoras . El propietario


ignora que dos de ellas tienen fallas en el sistema operativo. Si de las 10 máquinas selecciona cuatro
aleatoriamente para probar su funcionamiento,
¿Cuál es la probabilidad de una de las cuatro estén defectuosas?
¿Cuál es la probabilidad de que al menos una sea defectuosa?

32. Un producto industrial particular se envía en lotes de 200. Como la prueba para determinar si un
artículo está defectuoso es costosa, diseñó un plan de muestreo que recomienda muestrear 5 artículos
de cada lote y rechazar el mismo si resulta más de un artículo defectuoso. Si se rechaza se prueba
cada artículo del lote. Suponga que un lote contiene 8 artículos defectuosos.
Cuál es la probabilidad de aceptar el lote?
Utilice la distribución binomial como una aproximación de la hipergeométrica

33. Un auditor del Departamento del Impuesto sobre la Renta está seleccionando una muestra de 6
declaraciones de impuestos de personas de una profesión particular, para una posible auditoría. Si
dos o más de ellas indican deducciones “no autorizadas”, se auditará todo el grupo (población) de 100
declaraciones. ¿Cuál es la probabilidad de una auditoría más detallada si el porcentaje de
declaraciones incorrectas es:
a) 25 ?
b) 30 ?
c) Comente las diferencias en sus resultados dependiendo del porcentaje real de declaraciones
incorrectas.

34. El cuerpo secretarial de un importante bufete de abogados contiene 25 secretarias, 10 de las cuales
han estado con la firma más de 5 años. Si un ejecutivo selecciona al azar a 3 secretarias para asignarlas
a un asunto nuevo,
1. ¿Cuál es la probabilidad de que:
a) ninguna tenga más de 5 años de experiencia.
b) dos tengan más de 5 años de experiencia.
2. Escriba la expresión matemática que define la distribución de probabilidad del número de
secretarias con más de 5 años de experiencia.

35. Un auditor esta analizando los documentos por pagar de una empresa comercial. En este momento
hay 800 documentos firmados por esa empresa. Como el número de documentos es relativamente
elevado, el auditor decide extraer una muestra de 8 documentos e investigarlos. La decisión de aprobar
la cuenta o de seguir investigando depende del resultado de la nuestra. El auditor decide certificar las
cuentas por pagar, si a lo más uno de los 8 documentos muestreados es erróneo, y continuar
investigando si encuentra dos o más documentos erróneos.
Si en realidad hay 16 documentos erróneos.
a) ¿Cuál es la probabilidad de que el auditor certifique las cuentas?
b) ¿Cuál es la probabilidad de que decida continuar investigando?
Sugerencia: Aproxime las probabilidades con una distribución binomial.

36. Se embarcan motores eléctricos pequeños en lotes de 50. Antes de que tal cargamento sea
aceptado, un inspector elige 5 motores y los inspecciona. Si ninguno de los motores probados es
100
defectuoso, el lote es aceptado. Si se encuentra que uno o más son defectuosos, se inspecciona el
cargamento completo. Suponiendo que en realidad hay 3 motores defectuosos en el lote.
¿Cuál es la probabilidad de que no sea necesaria una inspección completa?

37. Un representante de ventas debe visitar 6 ciudades en un viaje. Suponga que existen 10 ciudades
en el área geográfica a visitar, de las cuales 6 de ellas son mercados primarios para el producto en
cuestión, mientras que las otras 4 constituyen mercados secundarios. Si el vendedor elige en forma
aleatoria las 6 ciudades que va a visitar.
1. Determine la expresión matemática que define la distribución de probabilidad del número de
ciudades que son mercados primarios.
2. ¿Cuál es la probabilidad de que:
a) cuatro de ellas resulten ser mercados primarios?
b) todas sean mercados primarios?

38. En la Contraloría General de la República (CGR) hay 20 solicitudes para trabajar como auditor.
Si se aprueban 10 solicitudes, ¿cuál es la probabilidad de qué se encuentren las 5 mejores de todas las
solicitudes?

39. Un banco tiene 100 cuentas de crédito, 8 de las cuales están atrasadas en sus pagos.
Se selecciona al azar y sin reposición 6 cuentas.
i) Determine la expresión matemática que define a la distribución de probabilidad del número de
cuentas atrasadas.
ii) ¿Cuál es la probabilidad de que dos estén atrasadas en sus pagos?
iii) ¿Cuántas cuentas espero que estén atrasadas en sus pagos?

40. El número promedio de llamadas por minuto recibidas en un taller de servicio de televisión es de
1.2
1. Determine la expresión matemática que define la distribución de probabilidad del número de
llamadas recibidas por minuto
2. ¿Cuál es la probabilidad de que en un minuto dado:
a) se reciban menos de dos llamadas
b) se reciban 4 llamadas
3. ¿Cuál es la probabilidad de que en 5 minutos dados.
a) se reciban 2 llamadas
b) al menos una llamadas

41. El promedio de accidentes por día en una fábrica de llantas es 3.2


1) ¿Cuál es la probabilidad de que en cualquier día ocurran
a) exactamente 4 accidentes?
b) por lo menos 2 accidentes?
2) ¿Qué probabilidad hay de que en un lapso de cinco días ocurran
a) exactamente 10 accidentes?
b) más de 2 accidentes?

42. En promedio cada minuto hay 6 personas esperando el elevador en el vestíbulo de un edificio de
oficinas, entre las 8 a.m. y 9 a.m
¿Cuál es la probabilidad de que durante un minuto dado entre las 8 a.m. y 9 a.m. estén esperando
cuando mucho 3 personas?
101
43. El número promedio de automóviles que se detienen por minuto para tomar gasolina en cierta
gasolinera a lo largo de una carretera es 1.2. ¿Cuál es la probabilidad de que en un determinado
minuto se detengan
a) menos de dos automóviles
b) dos o tres automóviles

44. Los empleados de una oficina del Banco Central atienden como promedio120 personas en una
hora de aglomeración. Si se sabe que como máximo estos empleados pueden atender 3 personas por
minuto, ¿Cuál es la probabilidad de que en un minuto dado:
a) no haya cola en la oficina?
b) haya cola en la oficina?
c) hayan 3 personas en la cola de la oficina?

45. El número promedio de interrupciones por hora en un proceso de producción es 0.8


1) ¿Cuál es la probabilidad de que en una hora determinada haya
a) exactamente 2 interrupciones?
b) menos de 2 interrupciones?
2) ¿Cuál es la probabilidad de que en un turno dado de ocho horas haya
a) exactamente 3 interrupciones?

46. Se supone según la experiencia que el 2% de las facturas de una empresa que vende libros por
correo están incorrectas. Si se selecciona una muestra aleatoria de 20 facturas, encuentre la
probabilidad de que cuando menos una factura este incorrecta
Sugerencia: Aproxime la probabilidad con una distribución de Poisson.

47. Una oficina policial del país Homicilandia reporta que en dicho país hay un número promedio de
2 homicidios diarios.
1. Construya la expresión matemática que define la distribución de probabilidad del número de
homicidios diarios.
2. Determine la probabilidad de que en un día determinado haya:
a) menos de 3 homicidios.
b) Al menos 2 homicidios.

48. Desde el año 1998, la clausura de bancos por problemas financieros ha ocurrido a razón de 5.7
clausuras por año, en promedio. Suponga que el número de cierres X en un determinado período de
tiempo tienen una distribución de probabilidad de Poisson.
a) Encuentre la probabilidad de que por lo menos tres bancos sean clausurados durante un año
determinado.
b) Encuentre la probabilidad de que ningún banco sea clausurado durante un período de 4 meses.

49. En una gran compañía de camiones de carga hay un promedio de dos camiones inactivos en un
día cualquiera, debido a reparaciones. Suponiendo que el número de camiones inactivos es una
variable aleatoria con distribución de Poisson y que la compañía tiene dos camiones extras.
¿Cuál es la probabilidad de que en un día :
a) No se necesiten camiones extras.
b) El número de camiones extras sea suficiente.

TEMA 4. DISTRIBUCION NORMAL


1. Explicar la necesidad de introducir el concepto de función de densidad de probabilidad de una
variable aleatoria contínua.
102
2. Definir la distribución normal y explicar sus principales características.
3. Poder transformar cualquier distribución normal en distribución normal estándar.
4. Calcular probabilidades de eventos definidos por variables aleatorias que siguen una distribución
normal.
5. Aplicar la distribución normal en la solución de problemas.

Si x1, x2,  , xk son todos los valores admisibles de una variable aleatoria discreta X entonces
cada valor xi contribuye con una cantidad f (xi) al total:

 f (x ) = 1
i

Cuando una variable aleatoria X es continua no tiene sentido hacer una suma de probabilidades en
el sentido anterior ya que su conjunto de valores posibles es no numerable.
En este caso, se generalizará el concepto de suma ( ) con el concepto de integral (  ).

Por tanto, cuando la variable aleatoria sea contínua será necesario introducir el siguiente concepto
que sustituya al de función de probabilidad de una variable aleatoria discreta.

Función de densidad de probabilidad de una variable aleatoria X continua.

Es una función f : R → R integrable, que cumple las siguientes condiciones:


i) f ( x)  0

+
ii) -  f (x)dx = 1

La probabilidad de que X tome un valor comprendido entre a y b será la siguiente área.

b
P(a  X  b) = a f (x)dx = A

Esto es, el área que existe entre la función, el eje x y las rectas x = a y x = b.

f(X)
103

a b X

Figura 4.1

No será interés hablar de la probabilidad de que X tome un valor particular a, ya que siempre
tendremos que:
P(X = a) = 0
Por esta razón, la probabilidad de que X tome un valor comprendido en un intervalo no se verá
afectada por el hecho de que este sea abierto o cerrado en cualquiera de sus extremos:

P(a X  b) = P(a  X  b) = P(a  X  b) = P(a  X  b)


P(X  a) = P(X  a)
P(X  a) = P(X  a)

De todos los modelos probabilísticos contínuos que existen estudiaremos a continuación el más
importante según sus aplicaciones a situaciones reales.

4.1 DISTRIBUCION NORMAL

Esta distribución es considerada la más importante por las siguientes razones:


1. Numerosos fenómenos contínuos parecen seguirla o se pueden aproximar mediante ella.
2. Se puede utilizar para aproximar distribuciones de probabilidad de variables aleatorias discretas.
3. Proporciona la base para la Estadística Inferencial.

EL MODELO NORMAL
Decimos que una variable aleatoria continua X, tiene una distribución normal con parámetros  y 2,
lo cual denotaremos por X  N (  , 2 ), si la función de densidad de probabilidad de X está
definida por:

2
1 x -  
1 -  
2 
f (x) = e 
, -  x  
 2
e = 2.71828 

CARACTERISTICAS.
104
1. Es una familia de distribuciones normales de tal forma que cada vez que se especifican los
parámetros  y 2 se identifica al correspondiente miembro de la familia, esto es, se produce una
distribución normal particular.

2. Los dos parámetros  y 2 coinciden con la media (esperanza) y la varianza respectivamente de


X, esto es

E(X) = 

V( X ) = 2  X = V( X )

3. Tiene forma de campana y el valor máximo de f ( x ) ocurre en x = . También tiene puntos de


inflexión que ocurren en x =  -  y x =  + 

-  + X

Figura 4.2

4. La mediana y la moda coinciden con  , y por lo tanto, es simétrica con respecto a  , así que

1
P(X   ) = P(X  ) =
2

5. A medida que x aumenta o disminuye a partir de  , f ( x ) decrece uniformemente, de tal forma


que cuando x →   , f ( x ) → 0. Esto significa que el eje X es asíntota de la curva normal,
en otras palabras, que a medida que x se aleja de  , en ambas direcciones, f ( x ) se acerca cada
vez más al eje X, pero nunca llega a tocarlo. Formando de esta manera colas que se extienden
indefinidamente en ambas direcciones.

6. La posición y forma de la campana dependerá respectivamente de los valores  y . Esto quiere


decir que  le dará posición a la campana, mientras que  le dará forma. Así que cuanto menor
105
sea , mayor área habrá concentrada alrededor de  y la curva será muy apuntada cerca de  , y
cuanto mayor sea , menor área habrá alrededor de  y más aplastada será la curva.

A C

1 2

Figura 4.3

En la figura 4.3 se dan tres funciones de densidad de probabilidad normales. Las funciones de
densidad de probabilidad A y B tienen la misma media  1 pero diferentes desviaciones estándar.
La desviación estándar de la función de densidad de probabilidad B es menor que la desviación
estándar de la función de densidad de probabilidad de A, motivo por el cual aparece más apuntada .
Por otra parte, las funciones de densidad de probabilidad A y C tienen la misma desviación estándar
 pero medias diferentes. Más aún, las funciones de densidad de probabilidad de B y C tienen
diferentes medias y también diferentes desviaciones estándar.

4.2 LA DISTRIBUCION NORMAL ESTANDAR

Si una variable aleatoria Z tiene una distribución normal con parámetros  Z = 0 y Z = 1 entonces
estamos en presencia de un miembro “muy honorable” de la familia, que llamaremos distribución
normal estándar. La figura 4.4 ilustra esta distribución.

Z = 1

Z = 0 Z

Figura 4.4

ESTANDARIZACION DE LA DISTRIBUCION NORMAL


106
Cada vez que apliquemos una distribución normal a una situación dada será necesario identificar un
miembro de la familia, esto es, una variable aleatoria X que tenga distribución normal con parámetros
 y  , con el fin de poder calcular las probabilidades solicitadas.
Lo anterior significa que cada situación o problemas tendría su propia distribución normal, lo cual
resulta muy incómodo.

Para evitar ese inconveniente convertiremos la variable aleatoria X que tiene distribución normal con
media  y desviación estándar  a otra variable aleatoria Z que tenga distribución normal estándar,
mediante la siguiente fórmula de transformación:

X - 
= Z

Esto es, las diferencias X -  expresadas en unidades de la desviación estándar.

A Z le llamaremos variable aleatoria estandarizada y su función de densidad de probabilidad estará


definida así:
1
1 - Z2
f (z) = e2 , -  z  
 2
El procedimiento de estandarización de una distribución normal puede apreciarse con el siguiente
gráfico.
 Z = 1

 X Z = 0 Z

Figura 4.5

En símbolos lo anterior puede escribirse así:

X - 
X~ N (  , )  = Z ~ N ( 0 ,1)

LA FUNCION DE DISTRIBUCION ACUMULADA DE LA VARIABLE ALEATORIA Z
Suponga que f ( s ) es la función de densidad de probabilidad de Z.

La función de distribución acumulada de Z se denota y define como

z
F(z) = P(Z z) = -  f ( s ) d s = A

Las figuras siguientes ilustran la función de distribución acumulada de Z.


107

0 z Z

Figura 4.6

z 0 Z

Figura 4.7
Con el propósito de no recurrir a los métodos de integración numérica se ha elaborado una tabla para
la función de distribución acumulada de Z, que nos permite leer directamente el valor de F ( z ) para
cualquier valor z.

USO DE LA TABLA
Note que la tabla consta de dos partes, una arriba, para los valores negativos de z y otra abajo para los
valores positivos de z.
Observe, para ambas partes de la tabla, que en el márgen izquierdo está el dígito unitario y una décima
de z, mientras que en el margen superior se encuentran las centésimas de z.

Ejemplo 4.1
Encuentre P ( Z  - 1.24 )

Aplicando la definición de función de distribución acumulada de Z tenemos que:

- 1.24
P ( Z  - 1.24 ) = F ( - 1.24 ) = 
-
f (z)dz

Para no calcular la integral definida anterior es que usaremos la tabla 1, que aparece en la página 111,
de la siguiente manera: Bajamos sobre el márgen izquierdo o columna z, de la parte de arriba de la
tabla, hasta encontrar -1.2, luego buscamos en el margen superior el 4.
Ahora tracemos dos líneas imaginarias, una horizontal que pase por –1.2 y otra vertical que pasa por
4. En la intersección de las líneas anteriores encontraremos el valor 0.1075.
De manera que F (-1.24 ) = 0.1075.

La ilustración gráfica del resultado anterior es


108

0.1075

- 1.24 0 Z

Figura 4.8

4.3 COMO CALCULAR PROBABILIDADE DE EVENTOS DESCRITOS POR


VARIABLES ALEATORIAS NORMALES.
Suponga que la variable aleatoria X tienen una distribución normal con parámetros  y 2. Estamos
interesados en calcular probabilidades de eventos de finidos por X. Según la forma en que se definan
estos eventos, consideraremos los siguientes casos:
Caso 1.
El evento tiene la forma X  c donde c es un valor determinado, queremos calcular P ( X  c ).
Lo primero que tenemos que hacer es estandarizar la variable aleatoria X y el valor c.

Una ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X  c )

 A 1
x - 
A = Z

c−
 c X 0 Z

Figura 4.9
El hecho anterior permitirá que:

c−μ c−μ
P(X  c) = P(Z  ) = F =A
σ  σ 

Esta área acumulada a la izquierda de c -  podemos leerla directamente en la tabla


Caso 2.
109
El evento tiene la forma X  c donde c es un valor determinado, queremos calcular P ( X  c ). Una
ilustración gráfica sería la siguiente donde se ha sombreado el área que representa P ( X  c ).

 c X

Figura 4.10

Como la distribución normal es simétrica podemos escribir que:

P(X  c) = 1 - P(X  c) = A

Esto es, el área acumulada a la derecha de c es igual a 1 menos el área acumulada a la izquierda
de c. El área acumulada a la izquierda de c, esto es, P ( X  c ) se encuentra aplicando el Caso 1.

Caso 3.
El evento tiene ahora la forma a  X  b donde a y b son valores determinados, queremos calcular
P ( a  X  b ). Una ilustración gráfica sería la siguiente donde se ha sombreado el área que representa
P ( a  X  b ).

a b X

Figura 4.11

Aplicando diferencias de áreas acumuladas a la izquierda de b y a podemos escribir que:

P(aXb) = P(X b) - P(X  a) = A

donde P ( X  b ) y P ( X  a ) se encuentran aplicando el caso 1 a cada una.

Ejemplo 4.2
110
El responsable de la investigación socioeconómica del sector de Managua del ejemplo 1.1 supone
que los ingresos de las familias del sector tienen una distribución normal con un ingreso familiar
mensual de 65 en cientos de córdobas y una desviación estándar de 15 en cientos de córdobas.
1. ¿Cuál es la probabilidad de que al seleccionar una familia del sector su ingreso familiar mensual

i) sea menor que 50 en cientos de córdobas

Suponga que la variable aleatoria X representa el ingreso familiar mensual de las familias

Sabemos que X  N (  = 65 ,  = 15 ) y que necesitamos calcular P ( X  50 ).

Una ilustración gráfica de la estandarización de X y 50 se da a continuación donde se ha sombreado


el área representada por P ( X  50 ).

 = 15

A = 0.1587 A = 0.1587

50  = 65 X -1 0 Z

Figura 4.12

Como el evento X  50 corresponde al Caso 1, tenemos que:

 
P ( X  50 ) = P  Z  50 - 65 

= P ( Z  - 1 ) = F ( - 1 ) = 0.1587
 15 

ii) sea por lo menos 44 en cientos de córdobas?

Aquí queremos calcular P ( X  44 ).

Una ilustración gráfica será la siguiente donde se ha sombreado el área representada por P(X 
44 ).

A = 0.9192

44  = 65 X

Figura 4.13
Como el evento X  44 corresponde al caso 2, tenemos que:
111
P ( X  44 ) = 1 - P ( X  44 )

donde según el caso 1, P ( X  40 ) = P  Z  40 - 65


 


= P ( Z  - 1.40)
 15 
= F ( - 1.40 ) = 0.0808
Luego P ( X  44 ) = 1 – 0.0808 = 0.9192.

Iii) esté entre 50 y 80.9 en cientos de córdobas?

Ahora queremos calcular P ( 50  X  80.9 )

La ilustración gráfica de esta situación se da a continuación donde se ha sombreado el área que


representa P ( 50  X  80.9 ).

A = 0.6967

50  = 65 80.9 X

Figura 4.14
Como el evento 50  X  80.9 corresponde al caso 3, tenemos que:

P ( 50 < X < 80.9) = P ( X  80.9) - P ( X  50 )

 80.9 - 65 
donde según el caso 1, P(X  80.9 ) = P  Z  

= P ( Z  1.06 ) = F (1.06 )
 15 
= 0.8554
Luego P ( 50  X  80.9 ) = 0.8554 - 0.1587 = 0.6967

2. Suponiendo que el sector tiene 1000 familias ¿Cuántas familias espero que tengan un ingreso mayor
que 44 en cientos de córdobas?

Como hay 1000 familias espero

1000 P ( X  44 ) = 1000 ( 0.9192 ) = 919.2 familias.

3. ¿Cuál es el máximo ingreso familiar mensual del 99% de las familias?


112
Recordemos que X representa el ingreso familiar mensual de las familias
Supongamos que “a” representa ese máximo ingreso familiar, entonces.

A = 0.99

 = 65 a X

Figura 4.15

P ( X  a ) = 0.99

Estandarizando X y a obtenemos  
P  Z  a - 65 

= P ( Z  2.33 )
 15 
El valor 2.33 se encuentra así:
Buscamos en el cuerpo de la tabla 4.1 el valor más cercano a 0.99 que debe ser 0.9901, luego trace a
partir de él una línea horizontal imaginaria hasta que toque el margen izquierdo de la tabla en 2.3 ;
después trace una línea imaginaria vertical hasta que toque el margen superior de la tabla en 3.

Ahora si las áreas acumuladas a la izquierda de a - 65 y 2.33 son iguales, entonces debe
15
cumplirse que: a - 65 = 2.33  a = 65 + 2.33 (15) = 65 + 34.95 = 99.95 en cientos de
15
córdobas.

Ejemplo 4.3
113
En la rama de la construcción está establecido por la ley un salario mínimo de C$ 12 por hora para los
obreros. Si suponemos que los salarios en esta rama están distribuidos normalmente con una media
de C$ 18 por hora y una desviación estándar de C$ 3.
i) ¿Qué porcentaje de los obreros podrían iniciar un proceso de demanda por incumplimiento a la
ley?
Supongamos que la variable aleatoria X representa al salario de los obreros.
Sabemos que X  N (  = 18 ,  = 3 ).
Cuando el salario X no llega al mínimo se puede iniciar un proceso de demanda, esto es, cuando
X  12. Por tanto calcularemos P ( X  12).

Una ilustración gráfica de la estandarización de X y 12 aparece a continuación donde se ha sombreado


el área representada por P ( X < 12 ).

 =3

A = 0.0227 A = 0.0227

12  = 18 X -2 0 Z

Figura 4.16

Como el evento X  12 corresponde al caso 1, tenemos que:

 
P ( X  12 ) = P  Z  12 - 18  = P ( Z  - 2 ) = 0.0227
 3 
El 2.27% de los obreros pueden iniciar un proceso de demanda

ii) Suponga que no se conoce la variación de los salarios, sólo el salario promedio de C$18 la hora
pero se sabe que el 5% de los obreros podrían iniciar un proceso de demanda, ¿Cuál sería la
desviación estándar de los salarios?

P ( X < 12 ) = 0.05

Estandarizando X y 12 obtenemos  
P  Z  12 σ- 18 
 = P ( Z  −1.64 )
 

Ahora si las áreas acumuladas a la izquierda de 12 - 18 y -1.64 son iguales, entonces debe

− 6
cumplirse que: 12 - 18 = -1.64  = −1.64  σ = C $3.6585
σ

114
iii) Suponga ahora que no se conoce el salario promedio, sólo la desviación estándar de C$3 la hora,
pero se sabe que el 5% de los obreros podrían iniciar un proceso de demanda, ¿Cuál sería el salario
promedio de los obreros?

P ( X < 12 ) = 0.05

P  Z  12 - 
 

 = P ( Z  −1.64 )

 3 

Ahora si las áreas acumuladas a la izquierda de 12 -  y -1.64 son iguales, entonces debe
3
cumplirse que: 12 -  = -1.64  12 – μ = 3(-164)  12 – 3(-1.64)  μ = C$ 16.92
3

iv) ¿Cuál es el menor salario que perciben los obreros que representan el 10% de los mejores
remunerados?
Suponga que c representa el menor salario que perciben el 10% de los mejores remunerados.
Entonces
P ( X  c ) = 0.10

Como el evento X  c corresponde al caso 2.

1 - P ( X  c ) = 0.10  P ( X  c ) = 0.90

Estandarizando X y c obtenemos  
P  Z  c - 18 

= P ( Z  1.28 )
 3 

c - 18
Luego = 1.28  c = 18 + 1.28 (3) = C$ 21.84
3
115
EJERCICIOS PROPUESTOS

1. Determine el área situada bajo la curva normal estándar que se encuentra:


a) entre z = 0 y z = 0.94
b) entre z = -2.15 y z = 0
c) a la derecha de z = 0.92
d) a la derecha de z = - 0.93
e) a la izquierda de z = 0.84
f) a la izquierda de z = -0.35

2. Determine z si el área de la curva normal.


a) A la derecha de z es 0.9983
b) a la derecha de z es 0.7324
c) a la izquierda de z es 0.1314
d) a la derecha de z es 0.2981

3. Las encuestas realizadas por una corporación financiera han revelado que la vida de una cuenta
regular de ahorros abierta en uno de sus bancos tiene una distribución normal con un promedio de 26
meses y una desviación estándar de 8.2 meses.
Si un depositante abre una cuenta en un banco que es miembro de esa corporación:
a) ¿Cuál es la probabilidad de que en esa cuenta haya todavía dinero después de 30 meses?
b) ¿Cuál es la probabilidad de que la cuenta haya sido cancelada antes de un año y medio?

4. La vida de un cierto tipo de tubo fluorescente está normalmente distribuida y su media es 1500
horas con una desviación estándar de 250. La UNAN colocará 1200 de ellos en el próximo año (en
el mes de Enero). Se calcula que esos tubos trabajarán 6 horas diarias, con 105 días de inactividad en
el año. Para confeccionar el plan de piezas de repuesto del próximo año, ¿Qué cantidad de tubos
habrá que tener de reserva para que se mantengan 1200 de ellos funcionando?

5. El número de días entre la facturación y el pago de las cuentas de crédito de un almacén tiene una
distribución aproximadamente normal con una media de 18 días y desviación estándar de 4 días.
a) ¿Qué proporción de las cuentas serán pagadas.
a.1. entre 12 y 18 días?
a.2. en menos de 8 días?
a.3. en 12 días o más.
b) ¿En cuántos días estarán pagadas el 99.5% de las cuentas?

6. La empresa Consolidada de Conformación de Metales produce varillas de aluminio. Se conoce


que según el proceso empleado se fabrican varillas cuyas longitudes son normalmente distribuidas
con media población igual a 6.00 pulg y desviación estándar igual a 0.30 pulg. Si las especificaciones
requeridas para las longitudes son desde 5.60 pulg hasta 6.50 pulg:
a) ¿Qué proporción de las varillas son cortas?
b) La empresa afirma que a lo sumo el 5% de las varillas resultan largas. ¿Es cierta dicha
afirmación? Explique su respuesta.

7. El editor de una editorial calcula que transcurren en promedio 11 meses antes de terminar el proceso
de publicación, desde la elaboración del manuscrito hasta terminar con el libro, con una desviación
estándar de 2.4 meses. Piensa que la distribución normal describe bien los tiempos de publicación.
De 19 libros que tendrá a su cargo este año, ¿aproximadamente cuántos finalizarán el proceso en
menos de un año ?
116
8. La duración de un determinado tipo de lavadora automática tiene una distribución aproximadamente
normal, con una media de 3.1 años y una desviación estándar de 1.2 años.
¿Qué proporción del total de unidades vendidas tendrá que ser reemplazado si la garantía es de un
año?

9. Suponga que el tiempo necesario para que germine una variedad de semillas de una planta está
normalmente distribuido con una media de 15 días y desviación estándar de 4 días.

a) ¿Qué proporción de las semillas deben germinar


a.1. antes de 19 días?
a.2. después de 23 días?
b) ¿A los cuántos días deben haber germinado tres cuartas partes de las semillas?

10. La dirección de carreteras de un estado se encuentra conque su ingreso anual por cuotas esta
normalmente distribuido con una media de 700000 dólares y una desviación de 50000. El gerente
desea saber:
a) La probabilidad de que queden cubiertos los gastos de operación del año próximo que
ascienden a 680000 dólares.
b) El monto del ingreso en el mejor 25% de los años.

11. En un estado hay x gasolineras cuyos ingresos son normalmente distribuidos con una media de
29000 dólares al año y una desviación estándar de 5100. Unas 189 gasolineras ganan entre 26000 y
31000 dólares al año. ¿Cuántas gasolineras hay en el estado?.

12. Supongamos que la vida útil de cierta marca de llanta de automóvil se distribuye aproximadamente
normal con media y desviación estándar iguales a 32,000 y 1000 millas respectivamente.
a) ¿Cuál es la probabilidad de que una llanta dure al menos 30,350 millas?
b) Si una empresa ha tenido que reemplazar el 5% de las llantas vendidas, ¿Cuál fue la garantía
utilizada?

13. Una empresa de jabonería y perfumería usa una máquina para llenar cajas con polvo facial. En
un informe del departamento de control estadístico de la calidad, se afirma que los pesos netos de las
cajas están distribuidos normalmente con una media igual a 15 onzas y desviación estándar igual a
0.8 onzas.
a) Se selecciona al azar una caja, ¿cuál es la probabilidad de que tenga un peso neto mayor de
14.5 onzas?
b) Si cierto día la máquina llena 1500 cajas, ¿cuántas cajas tendrán pesos netos menores que
14.5 onzas?

14. En un curso de Estadística el 15% de los estudiantes, los mejores, recibieron un premio y el 10%,
los peores, perdieron el curso.
Suponiendo que las calificaciones del curso están distribuidas normalmente con una media de 76
y una desviación estándar de 15.
i) ¿Cuál fue la calificación mínima para aprobar.
ii) ¿Cuál fue la calificación mínima para ganar un premio.

15. Se estima que aproximadamente la demanda semanal de diesel en una gasolinera estará
normalmente distribuida con una media de 1000 galones y una desviación estándar de 50 galones.
117
La gasolinera se abastecerá de diesel una vez a la semana. ¿Cuál debe ser la capacidad de su tanque,
si suponemos que la probabilidad de que se termine el diesel en una semana es 0

16. Supongamos que la calificación final de los estudiantes de Estadística II tiene una distribución
aproximadamente normal. El 28% de los estudiantes tuvieron calificación por debajo de 59 y el
12% por encima de 89.
Calcule la media aritmética y la desviación estándar.

17. En el RUCFA se quiere publicar una revista que aborde aspectos económicos de la vida
nacional. Los editores creen, por experiencias anteriores, que las ventas de la revista se distribuyen
aproximadamente normal, con una media igual a 2385 ejemplares. Se estima que existe una
probabilidad de 0.0495 de vender más de 3000 revistas. Calcule la desviación estándar para analizar
la variabilidad de las ventas.

18. Suponga para cierta marca y modelo de computadora, que el tiempo de operación en forma
efectiva (antes de la primera descompostura) sigue una distribución normal con una media de 350
horas y una desviación estándar de 50 horas.
1. ¿Cuál es la probabilidad de qué una computadora de esa marca y modelo opere efectivamente:
i) menos de 300 horas
ii) Por lo menos 280 horas.
iii) Entre 300 y 403 horas.
2. Suponga que un momento dado se disponen de 500 computadoras de esa marca y modelo, ¿Cuántas
espero que operen en formas efectiva después de 280 horas?.
3. ¿En cuántas horas estarán descompuestas el 99% de esas computadoras?

19. Café Soluble S.A. tiene una máquina para envasar, la cual llena de café los envases grandes de
tal manera que el peso neto del café en cada envase suponemos que está normalmente distribuido con
media igual a 283.5 gramos y una desviación estándar de 1 gramo.
¿Cuál es la probabilidad de encontrar un envase lleno que contenga:
i) más de 284 gramos?
ii) entre 282.1 gramos y 286.35 gramos?

20. La demanda semanal de artículos que produce una empresa es una variable aleatoria
aproximadamente normal con una media de 25 artículos y una desviación estándar de 2 artículos.
1) ¿Cuál es la probabilidad de que cierta semana la demanda sea:
i) Como máximo 27 artículos?
ii) Entre 10 y 20 artículos
2) ¿Qué cantidad de artículos debe mantener en existencia la empresa si quiere tener una
probabilidad de satisfacer la demanda en una semana de 0.99?

21. Suponga que el tiempo que necesita una Administración de Rentas para enviar las devoluciones
a los contribuyentes después de recibir la declaración de impuestos está distribuido normalmente
con una media de 12 semanas y una varianza de 9.
a) ¿Qué proporción de contribuyentes recibirá una devolución dentro de 6 semanas?
b) ¿Cuánto tiempo pasará antes de que el 90% de los contribuyentes obtengan sus devoluciones?

22. Una compañía de transporte determinó que, con una base anual, la distancia recorrida por
camión está distribuida normalmente con una media de 50,000 millas y una desviación estándar de
12,000 millas.
118
a) ¿Cuál es la probabilidad de que un camión seleccionado al azar recorra entre 34,000 y 38,000
millas en el año?
b) ¿Qué porcentaje de camiones se puede esperar que recorran menos de 30,000 o más de 60,000
millas al año?
c) ¿Cuántos de los 1,000 camiones de la flotilla se espera que recorran entre 30,000 y 60,000 millas
al año?

23. El cobro por llamadas telefónicas de larga distancia a Centroamérica sigue una distribución
normal con media de $21. Encuentre la desviación estándar del cobro por llamadas si el 80% de las
llamadas tiene un cobro superior a $17.50

24. La media y la desviación estándar de los porcentajes de reinversión de utilidades de las


empresas constructoras son del 40% y 10% respectivamente. Si se supone que esta variable tiene
una distribución normal calcule el porcentaje de empresas que reinvierten:
a) menos del 65%.
b) entre el 20% y el 60%.
c) más del 50%

25. Suponga que la ganancia mensual por comisiones que reciben los promotores de una empresa
recientemente instalada en nuestro país tiene una distribución normal con una media igual a $350 y
con una desviación estándar de $90.
i) Si se elige un promotor al azar, ¿Cuál es la probabilidad de que la ganancia sea
a) de menos de $ 185?
b) de más de $500?
c) entre 350 y 600?
ii) ¿Cuál es la máxima ganancia mensual del 97.5% de los promotores?

26. El peso neto de las cajas de cereales de una empresa sigue la distribución normal con un peso
promedio de 368 gramos. Encuentre la desviación estándar de los pesos si el 98% de las cajas tiene
un peso neto inferior a 400 gramos.

27. Supongamos que el largo de unos pernos es una variable aleatoria X que sigue un modelo normal
de media 11 cms. y una varianza de 4 cms 2 y que el fabricante clasifica los pernos, según su longitud,
en tres categorías:

A: X  8 ; B : 8  X  12 ; C : X  12

a) Si se pide una remesa de 2000 pernos ¿Cuántos deberían venir de cada categoría?
b) Si el 10% de los pernos de mayor longitud son considerados demasiado largos y el 15% de los
pernos de menor longitud son considerados demasiado cortos, ¿Entre qué longitudes un perno será
considerado correcto?
c) Si se mantiene la varianza, ¿Cuánto será la longitud promedia si los pernos de la categoría C
constituyen el 25% de la producción?

Tabla 1 Función de distribución acumulada de Z (Areas a la izquierda de z)


z 0 1 2 3 4 5 6 7 8 9
119

-3. .0013
-2.9 .0019 .0018 .0017 .0017 .0016 .0016 .0015 .0015 .0014 .0014
-2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019
-2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026
-2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036
-2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048
-2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064
-2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084
-2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110
-2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143
-2.0 .0227 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183
-1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233
-1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0300 .0294
-1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367
-1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455
-1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559
-1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681
-1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823
-1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985
-1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170
-1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379
-.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611
-.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1921 .1894 .1867
-.7 .2420 .2389 .2358 .2326 .2297 .2266 .2236 .2206 .2177 .2148
-.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451
-.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776
-.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121
-.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483
-.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859
-.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247
-.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641

.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8079 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9700 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9773 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3. .9987

BIBLIOGRAFIA

• Elementos básicos de Estadística Ecónomica y Empresarial


120
A. M. Montiel Torres
F. Rius Díaz
F. J Barón López
Prentice Hall, España, 1997

• Serie Schaum, Estadística aplicada a la Administración y a la Economía


Leonard J. Kasmier.
Mc Graw – Hill, Mexico, 1988

• Estadística Básica en Administración.


Mark L. Berenson
David M Levine
Mexico, Cuarta edición, Prentice Hall 1992

• Estadística para Administradores


Richard I. Levine
Prentice – Hall Hispanoamericana, S. A.
Mexico, segunda edición, 1988

• Guía de clases de Estadística I


Departamento de Matemática y Estadística.
Facultad de Ciencias Ecónomicas, UNAN
Marilú Zeledón

También podría gustarte