Libro Estadistica (Para Sabático 2018 Version Docente)

TECNOLÓGICO
NACIONAL DE MÉXICO
INSTITUTO TECNOLÓGICO DE VERACRUZ
LIBRO DE CONSULTA:
ESTADÍSTICA AVANZADA PARA
INGENIEROS INDUSTRIALES Y
ADMINISTRADORES DE
TECNOLOGICOS
COAUTORES: Eduargod, El Chiloso, Nani, Lupita, Karen, Aldo, Chema, La

Encabronada, Killerkombat117, El Meso Ples, Chema, Josmar, El Mamado,
Naomi, Jenny, Flor, Lucero, Itzel, Mafer.
VERACRUZ, VER. INVIERNO

2017 - 2018
DEDICATORIAS
“Para cristo, para mi familia, para las Chivas y para mis amigos y mis enemigos”
Toño Remes
“Quiero dedicar este libro a mi familia, que me ha enseñado el trabajar duro para
alcanzar mis metas y sueños, a mi hermana y mi pequeño sobrino, a Dios, a mis
amigos que siempre están ahí, a mis dos mejores amigos J. G y R. R. y a los
maestros que sin duda han contribuido de forma importante en mi desarrollo
humano.”
Manuel Eduardo Cruz Alarcón
“Este libro va dedicado a mi madre, mi hermano, mi amigo Javier que está allá
arriba junto a mi bisabuela y a todas las personas que dijeron que no iba a triunfar
y al mejor equipo de México, el Cruz-Azul.”
Jorge Toledo
“Mis dedicaciones van dirigidas a mis padres, que son parte fundamental en
formación académica, y a mi hermana, que es quien escucha mis problemas.”
Josmar Malpica
“Este libro lo dedico a mis padres y amigos y a los alumnos que no durmieron para
hacerlo.”
Fernanda Velázquez
“Dedicado a todas las personas que siempre han estado conmigo sin importar
nada, a mi mamá, mi papá, mis hermanos y mi familia, en especial a BRM por ser
mi compañero de vida, por enseñarme lo que es ser mejor, salir a delante y ser
feliz.”
Naomi Nava
2
“Dedico este libro a mi mamá, mi abuelita y mi tío Arturo, que son las personas
que más me apoyan día a día.”
Paola Ortega
“Dedico este libro a todos los que me han brindado apoyo y también a los que no,
porque me han hecho más fuerte.”
Flor Sánchez
“Este libro va dedicado a mis padres que siempre me apoyan, a mis compañeros
que trabajamos juntos durante todo el semestre, y por su puesto a mi profesor que
nos brindo toda su paciencia y conocimiento.”
Karen Fonseca.
“Dedico este trabajo a mis padres, mis hermanas, mis amigos y todos los que me
apoyaron este duro semestre.”
Jennifer Rosales
“Dedico este trabajo a toda mi familia y amigos que siempre me apoyaron en todo
momento ya que con su ayuda pude realizar lo logrado.”
Aldo Patlani
“Este libro o dedico a mi Dios, a mis padres, hermanos y amigos por su apoyo
incondicional a mi vida.”
Lucero Malpica
“Dedico este libro a Dios, porque tu presencia siempre ha sido el fundamento de

mi vida, por permitirme día a día adquirir nuevos conocimientos, herramientas
necesarias para poder salir adelante y proveerme siempre. A mis padres (Mauro &
Rosa) por apoyarme en todo. A mis compañeros y a usted Dr. Toño remes por su
esfuerzo y dedicación.”
Itzel Moreno
3
“Dedicado a Dios, a mi familia, a mis amigos y a mis profesores que han sido
parte importante en mi trayectoria académica y de mi vida.”
Lupita Rendón
“Lo dedico a mi familia, mis amigos, a The Arctic Monkeys, al “ferras”, a la

maquina celeste de la Cruz Azul, a México y a tu mamá (que me ama) y tu
hermana también.”
Maickol Portilla
"Dedicado a mis padres y a mis tiburones rojos"
Hector "Chema" Flores
“Este texto va dedicado a mi padre, madre, a dios, a toño y a todos los

compañeros que formaron parte de este proyecto.”
Erick Saldivar
“Dedico este libro a toda mi familia que siempre me han guiado por el camino
correcto, a mi hermosa novia Lupita Rivas que siempre me ha apoyado y me
motiva a seguir adelante y me enseña algo nuevo cada día, a mis verdaderos
amigos que a pesar de que no siempre los veo, sé que puedo contar con ellos en
cualquier momento, y a todas aquellas personas que han creído en mí.”
Gustavo Covarrubias
“Dedico a mis padres, abuelos y compañeros”
Nayeli Nara
4
ÍNDICE
1. DISTRIBUCIONES DE FRECUENCIA..................................................................8
1.1 CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN.............................8
1.2 RECOPILACIÓN DE DATOS........................................................................12
1.3 DISTRIBUCIÓN DE FRECUENCIAS............................................................13
1.3.1 POLÍGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS..............16
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS........20
1.5 MEDIDAS DE DISPERSIÓN PARA UN CONJUNTO DE DATOS
AGRUPADOS Y DATOS NO AGRUPADOS.......................................................27
1.5.1 Rango......................................................................................................27
1.5.2 DESVIACIÓN MEDIA (DM).....................................................................27
1.5.3 LA VARIANZA.........................................................................................31
1.5.4 DESVIACIÓN ETÁNDAR........................................................................35
2. INTRODUCCIÓN A LA PROBABILIDAD Y VALOR ESPERADO......................38
2.1 TEORÍA DE CONJUNTOS............................................................................38
2.1.1DEFINICION, PROPIEDADES Y OPERACIONES BASICAS CON
CONJUNTOS...................................................................................................38
2.1.2 TECNICAS DE CONTEO........................................................................49
2.1.3 DIAGRAMA DE ARBOL..........................................................................54
2.2 COMBINACIONES Y PERMUTACIONES....................................................56
2.3 INTRODUCCION A LA PROBABILIDAD......................................................59
2.3.1 DEFINICION Y EXPRESION..................................................................61
2.4 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES..........63
2.5 EVENTOS INDEPENDIENTES, DEPENDIENTES Y PROBABILIDAD
CONDICIONAL....................................................................................................66
2.6 TEOREMA DE BAYES..................................................................................69
2.7 VALOR ESPERADO O ESPERANZA MATEMATICA..................................70
3. TIPOS DE DISTRIBUCIONES, VARIABLES ALEATORIAS DISCRETAS Y
CONTINUAS............................................................................................................74
3.1 BINOMIAL......................................................................................................74
3.1.1 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR.....74
5
3.1.2 GRAFICA.................................................................................................79
3.2 LA DISTRIBUCIÓN DE POISSON................................................................82
3.3 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTANDAR............84
3.4 GRÁFICA.......................................................................................................87
3.5 HIPERGEOMÉTRICA....................................................................................94
3.6 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR............96
3.7 GRÁFICA.......................................................................................................97
3.8 NORMAL Y LOGARÍTMICO-NORMAL.......................................................100
3.9 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR..........110
3.10 GRÁFICA...................................................................................................118
3.11 APROXIMACIÓN DE LA NORMAL A LA BINOMIAL................................124
3.12 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR........125
3.13 GRÁFICA...................................................................................................127
4.- MUESTREO.....................................................................................................129
4.1 DEFINICIÓN DE MUESTREO.....................................................................129
4.1.1 TIPOS DE MUESTREO ALEATORIO, SISTEMATIZADO,
ESTRATIFICADO Y CONGLOMERADO.......................................................129
4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA............137
4.2.1 DISTRIBUCION MUESTRAL DE LA MEDIA CON VARIANZA
DESCONOCIDA Y CONOCIDA.....................................................................142
4.2.2 DISTRIBUCION MUESTRAL DE LA DIFERENCIA ENTRE DOS
MEDIAS CON VARIANZA DESCONOCIDA Y CONOCIDA..........................144
4.2.3 DISTRIBUCION MUESTRAL DE LA PROPORCION...........................147
4.2.4 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS
PROPORCIONES..........................................................................................148
4.3 TEOREMA DEL LIMITE CENTRAL.............................................................150
4.4 TIPOS DE ESTIMACIÓN Y CARACTERÍSTICAS......................................159
4.5 DETERMINACION DEL TAMAÑO DE LA MUESTRA DE UNA POBLACION
............................................................................................................................160
4.6 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA
DISTRIBUCIÓN.................................................................................................162
BIBLIOGRAFÍA......................................................................................................164
6
¿Sabías que…
Se le llama
distribución de
frecuencias a la
agrupación de
datos en
categorías
mutuamente
excluyentes que
indican el número
de observaciones
en cada categoría.
UNIDAD 1
DISTRIBUCIÓN DE
FRECUENCIA
7
1. DISTRIBUCIONES DE FRECUENCIA
1.1 CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN
La estadística es la ciencia que trata de la recolección, organización, presentación,

análisis e interpretación de datos numéricos con el fin de realizar una forma de
decisión más efectiva.
Estadística de negocios
Otorga las herramientas necesarias para reunir, analizar, presentar e interpretar
datos, en el campo de los negocios y la economía, proporcionando a quienes
toman decisiones una mejor comprensión del entorno comercial y económico, de
tal manera de ser más eficientes en su tarea.
Destinatarios: Empresarios, gerentes o funcionarios de empresas, tanto privadas
como estatales, ejecutivos de las aéreas de ventas y financieras y además
persona, que participen en actividades donde requieren tratamiento de la
información, como: control de calidad, encuesta de satisfacción y estudios de
mercado.
Estadística descriptiva
Es el proceso que se relaciona con los métodos y/o técnicas para la recopilación,
organización y análisis de un conjunto de datos cuantitativos, con el objeto de
describir en forma apropiada las diversas características de dicho conjunto
*Los datos del Censo de población de un año determinado.

*La cantidad de robos ocurridos el último mes en una ciudad concreta.
*La cantidad de pacientes atendidos en el Hospital municipal el último año.
Para ello, construimos las tablas de distribuciones de frecuencia, gráficas de
distribución de frecuencias, Diagramas de cajas, estadísticas de posición (media),
de dispersión (varianza) y de asociación.
Inferencia estadística
Es la técnica o metodología mediante la cual es posible realizar la estimación de

las características de una población o realizar la toma de decisiones basados en
resultados muéstrales.
*Una encuesta desarrollada por una empresa en marzo del 2010, dice que el
rating de radio en México está encabezado por radio fórmula con un 10,5%
seguido de la fiera con 9,18%.
8
POBLACIÓN. Es la totalidad de elementos de un grupo dado que posee una
característica delimitada para el alcance de una investigación.
MUESTRA. Se denomina muestra a una porción de datos representativos de

una población.
Variables discretas y variables continuas

Variables discretas
Las variables discretas son variables numéricas que tienen un número contable de
valores entre dos valores cualesquiera. Una variable discreta siempre es
numérica.
*El número de quejas de los clientes o el número de fallas o defectos. *Las

unidades de un artículo en el inventario de trabajo y el número de componentes
ensamblados que se han encontrado defectuosos.
Variables continuas
Las variables continuas son variables numéricas que tienen un número infinito de
valores entre dos valores cualesquiera. Una variable continua puede ser numérica
o de fecha/hora. *La longitud
de una pieza o la fecha y hora en que se recibe un pago. *El tiempo
transcurrido antes de que falle un dispositivo y el número promedio de personas
por hogar en una comunidad grande.
Métodos de muestreo aleatorio
Un muestreo aleatorio es aquel en el que cada uno de los elementos de la

población de interés, o población objeto, como se le conoce, tiene una
probabilidad conocida, y frecuentemente igual, de ser elegido para la muestra. A
las muestras aleatorias se les denomina también muestras probabilísticas o
muestras científicas. Y son cuatro los principales métodos de muestreo aleatorio:
simple, sistemático estratificado y por conglomerado.
Simple
Este tipo de muestreo consiste en elaborar una lista de la población

enumerándola, para posteriormente mediante la generación de número aleatorios
es seleccionado cada uno de los elementos que constituyen la muestra, o
mediante fórmulas de recurrencia diseñadas para éste propósito. Es adecuado
cuando la población es pequeña y los elementos puedan enumerarse.
9
Sistemático
En este tipo de muestro, también se elabora una lista con los elementos de la
población, pero en lugar de seleccionarlos de manera aleatoria, se recorre la lista
y se va seleccionando cada elemento con un intervalo uniforme que se mide en
tiempo, orden y espacio. Es más sencillo de aplicar que el simple, sin embargo, no
es posible de utilizar con poblaciones grandes o con la posibilidad de que la
población tenga datos con periodicidad.
Estratificado
En esta técnica, la población se divide en clases o estratos de acuerdo a una o

más características importantes para realizar posteriormente la selección, que
puede ser aleatoria o sistemática dentro de cada estrato. La definición de la clase
debe ser lo suficientemente clara para evitar que algunos de los elementos se
puedan ubicar en alguna de dos clases diferentes.
10
Conglomerados
Consiste en definir subgrupos de elementos homogéneos en forma natural y/o

existen grupos ya definidos. No se requiere seleccionar de todos los
conglomerados, y en ocasiones, es suficiente con seleccionar uno de los
conglomerados con todos sus elementos, es posible utilizar el muestreo aleatorio
considerando grupos en lugar de elementos.
11
1.2 RECOPILACIÓN DE DATOS
Al recoger datos relativos a las características de un grupo de individuos u objetos,

sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas
producidas en una fábrica, suele ser imposible o nada práctico observar todo el
grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado
población o universo, se examina una pequeña parte del grupo, llamada muestra.
Una población puede ser finita o infinita.
Población
Agregado de unidades elementales, que poseen alguna característica o
propiedades comunes.
El estudio de toda la población constituye un CENSO.
Una población puede ser finita o infinita.
En relación al tamaño de la población, ésta puede ser:
 Finita, como es el caso del número de personas que llegan al servicio de
urgencia de un hospital en un día; y se conoce el tamaño N de la
población.
 Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y cruces obtenida en el lanzamiento repetido de una
moneda al aire.
Muestra
Es una parte de la población. Se espera que la muestra sea representativa de la
población, es decir reproduzca las características más importantes. El proceso de
obtener la muestra de denomina MUESTREO.
Muestra aleatoria
12
Cuando la muestra ha sido obtenida empleando algún procedimiento del azar:
sorteo, extracción al azar, números aleatorios, etc.
1.3 DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma

de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se
representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma

mayúscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
13
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos
los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el número total de datos. Se puede expresar en tantos por
ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a
mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.
x Rec f F ni N 3 8 2 0. 0.
i uen i i i 1 4 2 7
to 5 7
2 I 1 1 0. 0. 8 4
7 0 0 3 III 3 2 0. 0.
3 3 2 7 0 8
2 2 9 7
2 II 2 3 0. 0. 7 1
8 0 0 3 III 3 3 0. 0.
6 9 3 0 0 9
5 7 9 6
2 6 9 0. 0. 7 8
9 1 2 3 I 1 3 0. 1
9 9 4 1 0
4 0 3
3 7 1 0. 0. 2
0 6 2 5 3 1
2 1 1
6 6
14
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de
la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48,
15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y
48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que
sea divisible por el número de intervalos de queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50: 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.
15
ci f F ni Ni 5 . 5 2
i i , 5 0 5
3
[ 2 1 1 0. 0. 0
0 . 0 0 )
, 5 2 2 [ 3 7 2 0. 0.
5 5 5 3 2 4 1 6
) 0 . 7 0
[ 7 1 2 0. 0. , 5 5 0
5 . 0 0 3
, 5 2 5 5
1 5 0 )
0 [ 3 1 3 0. 0.
) 3 7 0 4 2 8
[ 1 3 5 0. 0. 5 . 5 5
1 2 0 1 , 5 0 0
0 . 7 2 4
, 5 5 5 0
1 )
5 [ 4 4 3 0. 0.
) 4 2 8 1 9
[ 1 3 8 0. 0. 0 . 0 5
1 7 0 2 , 5 0 0
5 . 7 0 4
, 5 5 0 5
2 )
0 [ 4 2 4 0. 1
) 4 7 0 0
[ 2 3 1 0. 0. 5 . 5
2 2 1 0 2 , 5 0
0 . 7 7 5
, 5 5 5 0
2 )
5 4 1
) 0
[ 2 6 1 0. 0.
2 7 7 1 4
1.3.1 POLÍGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS.
16
Un polígono de frecuencias se forma uniendo los extremos de las barras de
un diagrama de barras mediante segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
Polígonos de frecuencia para datos agrupados
17
Para construir el polígono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectángulo de un histograma.
Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65

Polígono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se
obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.
18
Histograma
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran
número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud
del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores.
Ojiva
La representación gráfica de un cuadro de frecuencia acumulada son curvas
llamadas ojivas. En la gráfica de ojiva, el último intervalo no se une con el eje
horizontal.
La ojiva apropiada para información que presente frecuencias mayores que el dato
que se está comparando tendrá una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente
positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se
obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y
de igual manera que éstas, existen las ojivas mayores que y las ojivas menores
que.
19
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son e. media, mediana y moda. Las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable. Dicho en otros
términos las medidas de dispersión pretenden evaluar en qué medida los datos
difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto
permiten describir un conjunto de datos entregando información acerca de su
posición y su dispersión. Al describir grupos de diferentes observaciones, con
frecuencia es conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la distribución de datos
se denomina medida o parámetro de tendencia central o de centralización.
Cuando se hace referencia únicamente a la posición de estos parámetros dentro
de la distribución, independientemente de que esté más o menos centrada, se
habla de estas medidas como medidas de posición. En este caso se incluyen
también los cuartiles entre estas medidas.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.
20
Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, moda,
varianza y desviación estándar deben incluir una leve modificación. A
continuación, se entregan los detalles para cada una de las medidas.
Media, Media ponderada.
La media ponderada es una medida de tendencia central, que es apropiada
cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa
(o peso) respecto de los demás datos. Se obtiene multiplicando cada uno de los
datos por su ponderación (peso) para luego sumarlos, obteniendo así una suma
ponderada; después se divide está entre la suma de los pesos, dando como
resultado la media ponderada a la que corresponden los pesos:
La media ponderada (MP)
Es una medida de centralización. Consiste en otorgar a cada observación del
conjunto de datos (X1,X2,…,XN) unos pesos(p1,p2,…,pN) según la importancia de
cada elemento.
Cuanto más grande sea el peso de un elemento, más importante se considera

que es éste.
La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una
asignatura donde el examen final tiene un peso mayor al de un trabajo. O en el
cálculo del IPC (Índice de Precios de Consumo). El IPC es un indicador de los
precios de los bienes y servicios básicos que consume la población. Para
calcularlo, se otorga pesos a los diferentes bienes (pan, fruta, vivienda, …) y se
calcula la media ponderada.
La media aritmética es un caso particular de media ponderada, en la que todos
los pesos son uno, ya que a todos los elementos se les otorga la misma
importancia.
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los
datos, una vez que éstos están ordenados de menor a mayor. Por ejemplo, la
21
mediana del número de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor
de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los
siguientes Se toma como mediana
Existen métodos de cálculo más rápidos para datos más numerosos (véase
el artículo principal dedicado a este parámetro). Del mismo modo, para valores
agrupados en intervalos, se halla el "intervalo mediano" y, dentro de éste, se
obtiene un valor concreto por interpolación.
Cálculo de la mediana para datos agrupados

Primero hallamos las frecuencias absolutas acumuladas Fi (ver xi fi Fi
tabla del margen derecho). 1 2 2
Así, aplicando la fórmula asociada a la mediana para n impar, 2 2 4
obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace 3 4 8
referencia a las frecuencias absolutas:
4 5 13
Ni-1< n/2 <Ni = N19 < 19.5 < N20 5 6 19 =
Por tanto, la mediana será el valor de la variable que ocupe el 19
vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta 6 9 28
acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es 7 4 32
aconsejable no olvidar las unidades; en este caso como estamos 8 4 36
hablando de calificaciones, serán puntos)
9 2 38
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5
o más.
Ejemplo (N par)
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase
vienen dadas por la siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 6 9 4 4 2
22
Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen
derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par,
obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las
frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde
el vigésimo hasta el vigésimo octavo)
Con lo que Me = (5+6)/2 = 5,5 puntos.
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un
error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el
último número, deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos,
incluso cuando alguno de ellos no está acotado.
No se ve afectada por la dispersión. De hecho, es más representativa que la
media aritmética cuando la población es bastante heterogénea. Suele darse esta
circunstancia cuando se resume la información sobre los salarios de un país o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritmética
haciendo que pierda representatividad respecto al grueso de la población. Sin
embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana
más dinero que él, como que gana menos.
Sus principales inconvenientes son que, en el caso de datos agrupados en
intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se
presta a cálculos algebraicos tan bien como la media aritmética.
Moda
La moda es el dato más repetido de la encuesta, el valor de la variable con
mayor frecuencia absoluta. En cierto sentido la definición matemática corresponde
con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se
recurre a la interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-
6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
23
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces
es multimodal. Por último, si todas las variables tienen la misma frecuencia
diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se
ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia
absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:
Siendo la frecuencia absoluta del intervalo modal y las frecuencias absolutas de
los intervalos anterior y posterior, respectivamente, al intervalo modal.
La calificación en la asignatura de Matemáticas de 39 alumnos de una clase viene
dada por la siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Relación entre la media, mediana y moda

Cuando una distribución de frecuencia es simétrica, la media, mediana y moda
coinciden en su valor (X = Me = Mo). En el caso de una distribución binomial
simétrica, es necesario calcular el promedio de las modas.
En una distribución sesgada a la izquierda, la moda es menor a la mediana, y esta
a su vez menor que la media (X < Mo < Me)
En una distribución sesgada a la derecha la relación se invierte, la moda es mayor
a la mediana, y esta a su vez mayor que la media (Mo > Me >).
Ejercicios de medidas centrales
1.-La nota final de una asignatura es una media ponderada de las notas que han
obtenido los alumnos en los cuatro elementos evaluables que determina el
profesor. El responsable de la asignatura otorga un peso de 3 al examen inicial, de
1 al trabajo entregable, 2 al trabajo final y 4 al examen final. Las notas de un
alumno han sido las siguientes:
24
Se hace la suma de los productos de las notas por el peso de cada nota y se
divide por la suma de los pesos.
La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el

siguiente gráfico como la nota es muy próxima a las notas sacadas en los
exámenes. Esto es a causa de que los exámenes eran más importantes y tenían
unos pesos mucho mayores que los de los trabajos.
-
Ejemplo:
Promedio en datos agrupados
La fórmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes
valores de Yi.
Consideremos como ejemplo una distribución de frecuencia de
madres que asisten a un programa de lactancia materna,
clasificadas según el número de partos. Por tratarse de una
variable en escala discreta, las clases o categorías asumen
sólo ciertos valores: 1, 2, 3, 4, 5.
25
Entonces las 42 madres han tenido, en promedio, 2,78 partos.
Si la variable de interés es de tipo continuo será necesario determinar, para cada

intervalo, un valor medio que lo represente. Este valor se llama marca de clase
(Yc) y se calcula dividiendo por 2 la suma de los límites reales del intervalo de
clase. De ahí en adelante se procede del mismo modo que en el ejercicio anterior,
reemplazando, en la fórmula de promedio, Yi por Yc.
Mediana en datos agrupados
Si la variable es de tipo discreto la mediana será el valor de la variable que

corresponda a la frecuencia acumulada que supere inmediatamente a n/2. En los
datos de la tabla 1 Me=3, ya que 42/2 es igual a 21 y la frecuencia acumulada que
supera inmediatamente a 21 es 33, que corresponde a un valor de variable (Yi)
igual a 3.
Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia

acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente
fórmula:
Donde:
26
Moda en datos agrupados
Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi)

que tenga la mayor frecuencia absoluta (). En los datos de la tabla 1 el valor de la
moda es 3 ya que este valor de variable corresponde a la mayor frecuencia
absoluta =16.
Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza
y desviación estándar en datos agrupados con intervalos.
1.5 MEDIDAS DE DISPERSIÓN PARA UN CONJUNTO DE DATOS

AGRUPADOS Y DATOS NO AGRUPADOS
El rango es la diferencia
entre los valores mayores y
menor del conjunto de
datos My representa el dato
mayor y Mn representa el
dato menor
Ejemplo:
Durante un mes determinado del verano de ocho vendedores de
aparatos electrónicos de una empresa vendieron el siguiente número
de ventiladores: 8, 11, 5, 14, 8, 11,16
R= MY-Mn=16-5=11.0 unidades
27
1.5.1 RANGO
¿Qué son los rangos modificados?

Es un rango para el cual se elimina cierto porcentaje de los valores en cada uno
de los extremos de la distribución.
Algunos rangos modificados típicos son: 50% central ,80% y central y 90%
central
1.5.2 DESVIACIÓN MEDIA (DM)
¿Qué es la desviación media?

Se basa en la diferencia entre el valor absoluto de cada uno de los elementos
Ejemplo:
Para los datos de ventas de aparatos electrónicos 8,11,5,14,8,11,16,11, la

media aritmética es de 10.5 . Utilizando los cálculos de la siguiente tabla , se
determina la desviación media de la siguiente manera
DM=∑│X-µ│ = 21.0 = 2.625=2.6 unidades
N 8
Hoja de trabajo para calcular la desviación media de los datos de venta
Así puede decirse que en promedio, las ventas

de aparatos electrónicos por vendedor difieren
en 2.6 unidades de la media del grupo, en
cualquier dirección
Para Datos No Agrupados

Se utiliza la siguiente formula:
28
Ejemplo
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
Se calcula la desviación media.
Para Datos Agrupados en Tablas de Frecuencia

Se emplea la ecuación:
Ejemplo:
Calcular la desviación media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Cal Ca
ific nti
aci da
ón d
de
asi 29
gn
atu
ras
30
Solución:
Se calcula la media aritmética.
Para Datos Agrupados en Intervalos

Se emplea la ecuación:
Donde xm es la marca de clase.

Ejemplo:
Calcular la desviación media de un curso de 40 estudiantes en la asignatura
de Estadística en base a la siguiente tabla:
Calificación Cantidad de
estudiantes
2-4 6
4-6 8
6-8 16
8-10 10
Total 40
Solución:
Para calcular la media aritmética se llena la siguiente tabla:
31
Interval f x f·x
o m m
2-4 6 3 18
4-6 8 5 40
6-8 1 7 112
6
8-10 1 9 90
0
Total 4 260
0
Calculando la media aritmética se obtiene:
1.5.3 LA VARIANZA
La varianza es la media aritmética de los cuadrados de las desviaciones respecto

a la media aritmética, es decir, es el promedio de las desviaciones de la media
La varianza para una población se calcula con:
32
Para Datos Agrupados en Intervalos
Ejemplo:
Calcular la desviación estándar de los siguientes datos correspondientes a una
muestra.
Intervalo F
60-65 5
65-70 20
70-75 40
80-85 27
85-90 8
Total 100
Solución:
a) Se llena la siguiente tabla:
33
Intervalo f xm f·xm
60-65 5 62,5 312,5
65-70 20 67,5 1350
70-75 40 72,5 2900
80-85 27 82,5 2227,5
85-90 8 87,5 700
Total 100 7490
b) Se calcula la media aritmética.
d) Se calcula la desviación estándar.
34
Para Datos No Agrupados
1.5.4 DESVIACIÓN ETÁNDAR
Para la calcular la desviación estándar se sigue los siguientes pasos:

a) Se calcula la media aritmética.
b) Se aplica la respectiva fórmula para calcular la varianza
35
c) Se calcula la desviación estándar.
36
¿Sabías que…
La probabilidad
es una medida
de la certidumbre
asociada a un
suceso o evento
futuro y suele
expresarse como
un número entre
0 y 1 (o entre
UNIDAD 2 0 % y 100 %).
INTRODUCCIÓN A
LA PROBABILIDAD Y
VALOR ESPERADO
37
2. INTRODUCCIÓN A LA PROBABILIDAD Y VALOR
ESPERADO
2.1 TEORÍA DE CONJUNTOS
2.1.1DEFINICION, PROPIEDADES Y OPERACIONES BASICAS CON

CONJUNTOS
Un conjunto es una colección bien definida de objetos, animales o seres en

general.
Ejemplo 5.1:
Los estados de la República mexicana.
Cada miembro del conjunto se llama ELEMENTO. Los elementos se representan
con letras minúsculas, mientras que los conjuntos se representan con letras
mayúsculas. Los elementos que pertenecen al conjunto se encierran en una llave:
{ } Así por ejemplo, el conjunto de las vocales se representará de la siguiente
forma:
V= {a, e, i, o, u}
Entre elemento y elemento debe escribirse una coma, por otro lado, el orden en
que se escriben los elementos NO IMPORTA. Lo importante es que un mismo
elemento no deberá aparecer dos veces en el mismo conjunto.
No cualquier enunciado forma un conjunto. Cuando en un enunciado exista
ambigüedad, no puede decirse que es un conjunto.
Ejemplo 5.2:
Los maestros más capaces del Instituto Tecnológico de Tehuacán.
Esta proposición no representa un conjunto, ya que existe imprecisión en el
término CAPAZ. Si pedimos a cinco alumnos del Instituto Tecnológico de
Tehuacán que mencionen los nombres de los maestros más capaces,
primeramente, no todos coincidirían con el número de ellos, y si coincidieran en el
número, difícilmente coincidirían en los nombres.
Un enunciado será un conjunto si cuando se pide a un grupo perteneciente a una
misma cultura, contestan con los mismos datos.
Ejemplo 5.3:
Las ciudades mexicanas donde existe un Instituto Tecnológico.
Si pedimos a diez o más personas que escriban los nombres de las ciudades
donde existe un Instituto Tecnológico, todos coincidirán en el número y en los
38
nombres de las ciudades. Por eso la característica principal de un conjunto es que
esté bien definido.
En matemáticas existen dos maneras de enunciar un conjunto: por
ENUMERACION o TABULAR y por DESCRIPCION o COMPRENSION.
El conjunto se define por enumeración si se da la lista de los elementos que lo
forman.
Ejemplo 5.4:
Represente por enumeración el conjunto de letras que forman la palabra
ESTADISTICA
SOLUCION L= {e, s, t, a, d, i, c}
Aunque hay dos “s”, dos “t”, dos “a” y dos “i” en la palabra estadística nótese que
solamente se representó una sola vez.
CONJUNTO VACIO. - Es un conjunto que carece de elementos. Este conjunto se
suele llamar conjunto nulo. Aquí diremos de un conjunto semejante que es vacío y
se le denotará por el símbolo Ø.
Ejemplo 5.5:
Represente por enumeración el conjunto de personas vivientes mayores de 2000
años.
SOLUCION P= { }
Dentro de la llave no existe elemento alguno ya que no hay alguno que cuente con
las características señaladas; más no por eso se vaya a pensar que no es
conjunto.
El conjunto se describe en forma de comprensión cuando se enuncian la o las
características que sólo esos elementos tienen.
Ejemplo 5.6:
Represente por descripción el conjunto de números impares que estén entre el 8 y
26
SOLUCION A= {x/x es un número impar> 8 pero < que 26}
Se lee: A es el conjunto de elementos, tales son números impares mayores de 8
pero menores de 26, o A es el conjunto de Xs, tal que las Xs toman valores de
números impares mayores de 8, pero menores de 26.
En ocasiones se pide que un conjunto expresado por enumeración sea expresado
por descripción.
Ejemplo 5.7:
Sea el conjunto
39
A= {Estados Unidos, Guatemala, Belice}
a) Definirlo por descripción
SOLUCION ERRONEA A= {x/x es un país de América}
La descripción es equivocada ya que las características señaladas las poseen
también otros países. Debe describirse otra característica que sólo Estados
Unidos, Guatemala y Belice posean y ninguno más.
SOLUCION CORRECTA A= {x/x es un país fronterizo de México}
SUBCONUNTO. - Sean dos conjuntos A y B
Ejemplo 5.8:
A= {a, e, i, o, u} B = {a, e, i}
Obsérvese que todos los elementos de B también los tiene A. Cuando todos los
elementos de un conjunto los tiene otro conjunto, se dice que el primero es
SUBCONJUNTO del segundo. En el ejemplo 5.8, B es subconjunto de A. La
expresión anterior se representa de la siguiente forma: B ‫ﮞ‬A
Ejemplo 5.9:
Sean los conjuntos:
D= {a, c, e, r, o} E= {c, a, m, p, e, o, n}
Obsérvese que los elementos de D: a, c, e, r, o los contiene E pero no el elemento
“r”. Por lo tanto, D no es subconjunto de E, esto se simboliza como DȼE.
Como se ve, basta con que un elemento no pertenezca a otro para que no se
establezca la relación de SUBCONJUNTO.
Una de las operaciones más útiles en estadística es la que consiste en formar
conjuntos derivados de un conjunto mayor dado; esto es formar
SUBCONJUNTOS.
Ejemplo 5.10:
Formar todos los subconjuntos que se pueda con los elementos del conjunto A
A= {g, a, s}
SOLUCION {g}; {a}; {s}; {g, a}; {g, s}; {a, s}; {g, a, s}; Ø.
En total son 8 subconjuntos que pueden formarse. Quizá se crea que faltan más,
ya que se puede formar un subconjunto como el siguiente {g, a} y {a, g}; pero hay
que recordar que el orden de los elementos de un conjunto carece de importancia,
por lo tanto, los dos subconjuntos anteriores son el mismo. Otra duda podría ser si
el conjunto vacío es subconjunto de A, si ni siquiera tiene elementos. Vamos a
demostrarlo: Quedó establecido que, si todos los elementos de un conjunto los
40
contiene otro conjunto, el primero es subconjunto del segundo. Además, si el
primer conjunto tiene algún elemento que el otro no tiene, entonces el primero no
es subconjunto del segundo.
Tratemos de demostrar que el conjunto vacío no es subconjunto del conjunto A.
Para lograrlo, tendremos que encontrar algún elemento que esté en el conjunto
vacío Ø, pero que no esté en A. Si hallamos algún elemento que esté en Ø y que
no esté en A, entonces ØȼA. Como por definición Ø carece de elementos;
entonces Ø no contiene ningún elemento que no contenga A. Concluimos que Ø
es subconjunto de A.
En general, el conjunto vacío es subconjunto de cualquier conjunto de sí mismo.
Es muy importante saber de antemano cuántos subconjuntos se pueden formar
con los elementos de un conjunto, para que no tengamos duda si nos hace falta
alguna. A continuación, deduciremos la fórmula que establece el total de
subconjuntos que se pueden formar con los elementos de un conjunto dado a
partir de la tabla 5.1
CONJUNTO NUMERO DE SUBCONJUNTO NUMERO DE

ELEMENTOS S SUBCONJUNTOS
{} 0 Ø 1= 2°
{a} 1 Ø, {a} 2= 2^1
{a, b} 2 {a}, {b}, {a, b}, Ø 4= 2^2
{a, b, c} 3 {a}, {b}, {a, b}, {a, 8= 2^3
b, c}, Ø
Tabla 5.1 Número de subconjuntos.
En la tabla 5.1 notamos que hay una relación entre el número de elementos que
tiene el conjunto y el exponente que tiene la base 2 es el mismo. Así que, si un
conjunto x tiene cuatro elementos sabremos de antemano que se pueden formar
2^4 subconjuntos, es decir 2x2x2x2= 16
P= 2^n n= número de elementos (5.1)
Fórmula 5.1 Establece el total de subconjuntos que se pueden formar con los
elementos de un conjunto o sea el CONJUNTO POTENCIA.
En la práctica lo importante es conocer cuántos subconjuntos de un conjunto con
cierto número de elementos se pueden formar.
Ejemplo 5.11: Si un conjunto tiene 7 elementos, ¿Cuántos subconjuntos que
tengan sólo 3 elementos de los 7 se pueden formar?
SOLUCION
41
Enumerándolos sería demasiado tedioso. Para encontrar el número de
subconjuntos que se pueden formar con las condiciones señaladas se aplica la
siguiente fórmula.
(5.2)
Para entender la fórmula anterior, substituiremos las letras por los números
mencionados en el problema.
7 El 3 nos dice que en el numerador y en el denominador debe haber tres
factores;
3 en el numerador el primer factor es 3. Los factores que le siguen se disminuyen
en la unidad.
7 = 7x6x5= 35 subconjuntos
3 3x2x1
Existen 35 subconjuntos de 3 elementos, que se pueden formar con los elementos
del conjunto dado.
Ejemplo 5.12:
Se tienen 12 objetos de los cuales se desean regalar 4. ¿De cuantas maneras se
puede escoger?
SOLUCION
12 = 12X11X10X9= 11880= 495 maneras

4 4x3x2x1 24
Existen 495 maneras (subconjuntos) de efectuar el regalo.
Operaciones con conjuntos. -

En aritmética se suma, resta y multiplica, es decir, a cada par de números x e y se
le asigna un número X + Y llamado suma de X e Y, un número X-Y llamado
diferencia de X e Y y un número XY llamado producto de X e Y. Estas operaciones
se llaman operaciones de adición, substracción y multiplicación de números. En
esta unidad se van a definir las operaciones de UNION, INTERSECCION,
DIFERENCIA de conjuntos, es decir, se van a asignar o hacer corresponder
nuevos conjuntos a pares de conjuntos A y B.
Diagramas de Venn. –
Son la representación
gráfica de los conjuntos. El
42
conjunto UNIVERSO (U), se representa por medio de un rectángulo. Los conjuntos
(C) cuyos elementos se toman del universo, se representan por círculos u óvalos,
dibujados dentro del rectángulo, figura 5.1 Figura 5.1 Diagrama
de Venn
Figura 5.2 Si dentro de un universo hay un conjunto, existirán dos regiones. Cada
región es excluyente de las demás.
Figura 5.2 Conjunto universo con dos regiones
Características de las regiones:

R1: Se encuentran los elementos que pertenecen a A
R2: Se encuentran los elementos que no pertenecen a A
Figura 5.3 Si dentro de un universo existen dos conjuntos, habrá cuatro regiones,
en caso de conjuntos no ajenos. Cada región tiene elementos con características
muy propias.
Figura 5.3 Conjunto universo con cuatro regiones

Características de cada una de las regiones y sus elementos:
R1: Contiene los elementos que únicamente pertenecen a A
R3: Contiene los elementos que únicamente pertenecen a B
R2: Contiene los elementos que pertenecen a A y a B
43
En R1 y R2 se encuentran los elementos que son de A
En R2 y R3 están los elementos que pertenecen a B
En R1 y R4 están los elementos que no pertenecen a B
En R3 y R4 están los elementos que no pertenecen a A
En R1, R2 y R3 están los elementos que pertenecen a A o a B
Es muy importante que se sepa identificar las características de cada una de las
regiones, para entender las operaciones con conjuntos.
Unión de conjuntos. –
Sean dos conjuntos A y B que se simboliza A U B, representa la unión de A con B
y se forma otro conjunto que tiene todos los elementos de A y los de B.
Ejemplo 5.13:
Encontrar el conjunto de A U B y representarlo en un diagrama de Venn.
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e}
Solución A U B= {s, i, r, e, n, a, o, m, c}
44
A U B gráfica sombreada
Intersección de conjuntos. –
Sean dos conjuntos A y B. La intersección de A y B es el conjunto de elementos
que pertenecen tanto a A como a B. se representa por el símbolo п, la
presentación algebraica de la intersección de los conjuntos del ejemplo 5.13,
numérica y gráficamente.
Solución
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e} AпB= {r, e, n, a}
Ya que sólo estos son los elementos que son comunes a los dos conjuntos, la
representación gráfica sería.
AпB
En forma general tenemos sombreada el área perteneciente a la intersección.
45
AпB
Diferencia entre conjuntos. –
Para explicar esta operación entre conjuntos, emplearemos los conjuntos del
ejemplo 5.13.
La DIFERENCIA del conjunto A menos el conjunto B es el conjunto de elementos
que son de A pero, no de B, o sea, son los elementos que pertenecen únicamente
a A.
Ejemplo 5.15:
Realizar la diferencia A – B
SOLUCION
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e} A – B= {s, i}
Los otros elementos de A no se incluyen, ya que pertenecen a A y pertenecen a B
y la diferencia consiste en anotar los elementos que sólo pertenecen a A.
Ejemplo 5.16:
Encontrar la diferencia B – A de los conjuntos del ejemplo 5.13 numérica y
gráficamente.
SOLUCION
B= {r, o, m, a, n, c, e} A= {s, i, r, e, n, a} B –A= {o, m, c}
46
B–A B–A
Observando A U B= (A B) + (A – B) + (B – A); es decir, la intersección y las
diferencias son subconjuntos de la unión.
Complemento. -
Si tenemos un conjunto universo y de él tomamos elementos para formar el
conjunto A, el complemento de A que se simboliza Ac, es el conjunto de los
elementos que no están en A.
Ejemplo 5.17:
Sea el conjunto universo U= {0, 1, 2, 3, 4, 5, 6, 7, 8} y el conjunto A= {2, 3, 5, 7},
formar el conjunto Ac y representarlo con diagramas de Venn.
Solución
Ac= {0, 1, 4, 6, 8}
De lo anterior derivemos los siguientes postulados:
PRIMERO A U Ac= U A unión complemento de A es igual al conjunto universo.
SEGUNDO A п Ac= Ø A intersección con A complemento es igual al conjunto
vacío.
47
Ac Ac
Ejemplo 5.18
Sea U= {g, o, t, a, s, i, n, d, u, c, e}
A= {g, o, t, a, s}
B= {s, a, t, i, n}, encontrar
a) Ac
b) (A U B)c
c) Ac п B
SOLUCION
a) Ac= {i, n, d, u, c, e}
b) (A U B) c= Primero realizaremos la operación señalada dentro del
paréntesis. Esto se hace siempre que existe un paréntesis. Después se
realiza la operación señalada fuera del paréntesis.
(A U B) = {g, o, t, a, s, i, n}
El complemento de (A U B) serán todos los elementos que estén fuera de esta
unión, como son:
(A U B) c = {d, u, c, e}
c) Ac п B antes de realizar la intersección deberemos encontrar el
complemento de A.
Ac= {i, n, d, u, c, e} Son todos los elementos que no están en el conjunto A.
Ac п B= {i, n, d, u, c, e} п {s, a, t, i, n} = {i, n}
Operaciones con conjuntos. –
Las operaciones con conjuntos al igual que en los números, satisfacen ciertas
propiedades o-leyes. Estas leyes se muestran en la tabla 5.2
LEYES DEL ALGEBA DE CONJUNTOS

LEYES DEL ALGEBRA DE CONJUNTOS
Leyes de idempotencia
1a. A U A - A lb. A п A = A
Leyes asociativas
2a. AUB)UC = AU(BUC) 2b.(AпB)пc = Aп(BnC)
48
Leyes conmutativas
3a. AUB = BUA 3b. AпB . BпA
Leyes distributivas
4a. Aп(BпC) = (AUB)п(AUc) 4b. Aп(BUC)
= (AпB)u(Aпc)
Leyes de identidad
P-1( -
5a. AUØ = A 5b. AпU = A

,/,‘:
6a. AUU = U 6b. AnØ = Ø
, Leyes de complemento
7a. AUAC = U 7b. AпAC = 0
8a. (Ac)C = A 8b. Ue = 0, Øc= U
Leyes de Morgan
k-_
9a. (AUB)c = Ac n Bc- 9b; (AпB)c = AcUBc
TABLA 5.2 LEYES DEL ALGEBRA DE CONJUNTOS
2.1.2 TECNICAS DE CONTEO
EL Análisis Combinatorio, también llamado TECNICAS DE CONTEO, es esencial

para iniciarse en la teoría de la probabilidad, además permite determinar el
número total de posibles resultados lógicos que cabe esperar al realizar algún
EXPERIMENTO, sin tener necesidad de enumerar cada uno de ellos.
Antes de establecer el principio básico del conteo dile es la base del análisis
combinatorio, se definirá el concepto de factorial.
Factorial. -
Se llama factorial de un número, al producto consecutivo de todos los números
enteros desde el uno hasta el número dado, inclusive si "n" es el número dado, su
factorial se representa con la - notación n! y valdrá
n! = 1x2x3...x(n-2)(n-1)n
n! = n(n-1)(n-2)...3x2x1
n! = n(n-1)! FORMULA FUNDAMENTAL DEL FACTORIAL
Con el objeto de aplicar esta FORMULA de manera general, aún para el caso de
que n = 1, se ampliará el concepto de factorial con las dos definiciones siguientes:
0!= 1
1!= 1
49
Ejemplo 6.1:
Efectuar las operaciones con factoriales siguientes:
a) 5!= 1x2x3x4x5= 120
b) 7!= 7x6x5x4x3x2x1
= 7x6x5!
= 7x6x120
=5040
c) 9! = 9x8x7x6! = 9x8x7= 504
6! 6!
d) Cuando realice una multiplicación de dos factoriales, tenga cuidado de no
cometer este error
(3!) (4!) = 12!
Lo correcto es calcular el valor de cada factorial y solo después efectuar la

multiplicación
(3!9 (4!) = (3x2x1) (4x3x2x1)
= (6) (24)
=144
e) Calcule n!
(n-3)!
= n (n-1) (n-2) (n-3)!
(n-3)!
=n (n-1) (n-2)
Principio fundamental de conteo (principio multiplicativo)
“Si un acto puede efectuarse de n1 maneras diferentes y, efectuando éste, un

segundo acto puede efectuarse de n2 maneras distintas, entonces ambos actos
pueden efectuarse en el orden indicado de n1 * n2 maneras distintas”.
El principio fundamental establecido puede generalizarse para cualquier número

de actos que se tengan. Así por ejemplo, si un tercer acto puede realizarse n3
maneras distintas, se puede considerar como un solo acto la verificación de los
dos primeros, que pueden hacerse de n1*n2 maneras diferentes y al aplicar el
principio fundamental del conteo, se obtiene que (n1*n2)n3 es el número de
maneras en que pueden efectuarse los tres actos.
Principio fundamental del conteo

Ejemplo 6.2
50
Para ir del punto A al B existen tres caminos, y para ir del punto B al C existen dos
caminos diferentes, como se muestra en la figura 6.1
a) ¿De cuantas maneras diferentes se puede ir de A a C pasando por B?

b) ¿De cuantas maneras diferentes se puede ir de A a C pasando por B y
regresar a B?
c) ¿De cuantas maneras diferentes se puede hacer un viaje redondo de A a C,
si no se permite usar cada camino más de una vez?
B
A C
Figura 6.1 caminos entre tres puntos.
SOLUCION
a) Para resolver el ejemplo aplicando el principio fundamental del conteo, se
dividirá el problema en los siguientes actos:
- Primer acto: Escoger el camino para ir de A a B, tres maneras diferentes.
- Segundo acto: Escoger el camino para ir de B a C, dos maneras diferentes.
Luego hay 3x2 = 6 maneras diferentes para ir de A a C pasando por B. De la
figura 6.1 se ve que estas son las formadas por los tramos: t1t4, t1t5, t2t4, t2t5,
t3t5, t3t5.
b) Dividiendo nuevamente el problema en actos, se tiene:
-Primer acto: Escoger el camino para ir de A a C pasando por B, hay seis
maneras diferentes (del inciso anterior)
- Segundo acto: Escoger el camino para ir de C a B, hay dos maneras
diferentes.
Por lo tanto, hay 6x2 = 12 caminos diferentes para ir de A a C pasando por
B y regresando a B.
c) Procediendo en forma idéntica a los incisos anteriores y teniendo en cuenta
ahora que no se puede usar un camino ya recorrido con anterioridad, se
tiene:
-Primer acto: Escoger el camino para ir de A a B, hay tres maneras.
-Segundo acto: Escoger el camino para ir de B a C, hay dos maneras.
-Tercer acto: Escoger el camino para ir de C a B, hay una manera.
-Cuarto acto: Escoger el camino para ir de B a A, hay dos maneras.
Y hay 3x2x1x2 = 12 maneras de hacer un recorrido redondo de A a C y regreso
sin circular más de una vez por un mismo tramo
.
51
Ordenaciones. –
Se llaman ordenaciones “n” objetos de orden r a los diferentes grupos ordenados
que se pueden formar al escoger r objetos de un grupo de “n” objetos dados, de tal
manera que dos ordenaciones se consideran distintas si difieren en alguno de sus
objetos o en el orden de ellos.
Ordenaciones simples sin repetición. -
En la definición anterior se ha considerado implícitamente que el orden r es menor
que el número “n” de objetos dados, lo que equivale a no permitir la repetición de
objetos en una misma ordenación.
Ejemplo 6.3
Formarlas ordenaciones de todas las ordenes de las cuatro letras a, b, c, d
Solución
Ordenaciones de orden 1:
a b c d
ab ba ca da
ac bc cb db
ad bd cd dc
abc bac cab dab
abd bad cad dac
acb bca cba dba
acd bcd cbd dbc
adb bda cda dca
adc bdc cdb dcb
abcd bacd cabd dabc
abdc bacd cadb dacb
acbd bcad cbad dbac
acdb bcda cbda dbca
adbc bdac cdab dcab
adcb bdca cdba dcba
52
Para determinar cuántos grupos ordenados se pueden formar al escoger r objetos
de entre “n” objetos dados, de tal manera que dos de tales grupos se consideren
distintos si difieren en alguno de sus objetos o en el orden de ellos, aplicando el
principio fundamental del conteo se obtiene la fórmula:
Ejemplo 6.4
Calcular el número de arreglos diferentes de tres letras que se pueden formar con
las letras de la palabra OLIVERA, si en los arreglos no se permiten tener letras
repetidas.
Solución
Teniendo en cuenta que la palabra OLIVERA presenta siete letras, de las que se
requiere formar grupos ordenados de tres letras, se tiene:
Ordenaciones con repetición. -

Son ordenaciones en donde pueden repetirse objetos en una misma ordenación,
por lo que puede suceder que el orden r de las ordenaciones con repetición sea
mayor que el número “n” de objetos dados.
Ejemplo 6.5
Formar las ordenaciones con repetición de orden 1 y 2 de las cuatro letras a, b, c,
d.
Solución
Ordenaciones con repetición de orden 1:
a b c d
Ordenaciones con repetición de orden 2.
aa ba ca da
ab bb cb db
ac bc cc dc
ad bd cd dd
53
Análogamente a las ordenaciones simples, el principio fundamental del conteo
permite obtener la fórmula para el número de ordenaciones con repetición de “n”
objetos de orden r, teniendo en cuenta que ahora cada uno de los r objetos puede
seleccionarse de “n” maneras distintas. Representando con ORnr al número de las
ordenaciones con repetición de “n” objetos de orden r, se obtiene:
Ejemplo 6.6
Se tienen 20 banderas, de las cuales cinco son blancas, cinco negras, cinco rojas
y cinco azules. Calcular el número de señales diferentes que se pueden formar al
colocar cinco banderas simultáneamente.
Solución
Al tener por lo menos cinco banderas de cada color, se está permitiendo repetir un
color todas las veces necesarias; por lo tanto, se trata de determinar el número de
grupos ordenados que se pueden formar al seleccionar, con repetición, cinco
objetos de un grupo de sólo cuatro. El número de señales es entonces:
2.1.3 DIAGRAMA DE ARBOL
Un diagrama de árbol es una herramienta gráfica que se usa para enumerar todas
las posibilidades lógicas de una secuencia de actos o eventos que ocurran de un
número finito de maneras. En la gráfica se representan por medio de rectas las
diferentes acciones que se pueden elegir, llamadas las “ramas del árbol”. Las
ramas parten de puntos que representan instantes de tiempo o lugares en el
espacio, llamados los nodos del árbol, en donde se elige una de las posibles
formas lógicas de actuar. Las ramas llegan a nuevos nodos en donde se vuelve a
decidir sobre nuevas acciones a tomar. La construcción de los diagramas de árbol
se ilustrará en el siguiente ejemplo:
54
Ejemplo 6.13
Construir los diagramas de árbol de cada uno de los incisos del ejemplo 6.2
SOLUCION
Hay seis formas diferentes de ir Hay doce formas diferentes de ir de

De A a C pasando por B A a C pasando por B y regresar a B
55
Hay doce formas diferentes de hacer viajes redondos de A a C sin usar un tramo
más de una vez.
2.2 COMBINACIONES Y PERMUTACIONES
Se llaman combinaciones de “n” objetos de orden “r”, a los diversos grupos que
pueden formarse al elegir “r” objetos de “n” objetos dados, de tal manera que dos
combinaciones se consideren distintas si difieren en uno de sus objetos por lo
menos.
A diferencia de las ordenaciones, en las combinaciones no interesa el orden de los
objetos, sino únicamente la clase de los mismos.
En la definición de combinación también se supuso implícitamente que el orden “r”
no es mayor que el número “n” de objetos dados, de manera de no permitir la
repetición de objetos en una misma combinación.
Ejemplo 6.10
Formar las combinaciones de todas las órdenes de las cuatro letras a, b, c, d
Solución
Combinaciones de orden 1: a b c d
Combinaciones de orden 2: ab bc cd
ac bd
ad
Combinaciones de orden 3: abc bcd
abd
acd
Combinaciones de orden 4: abcd.
La fórmula para obtener el número de combinaciones de “r” elementos tomados de
un conjunto que tiene “n” elementos es:
Ejemplo 6.11
56
De un grupo de diez personas, debe elegirse un comité formado por cinco.
Calcular el número de comités diferentes que se pueden elegir, si:
a) Las diez personas son elegibles libremente.
b) Dos de las personas elegibles no pueden aparecer juntas en el comité.
c) Dos de las personas elegibles deben estar siempre juntas, dentro del
comité o fuera de él.
d) En el comité debe haber un presidente.
SOLUCION
a) Las cinco personas pueden seleccionarse de las diez elegibles de:
b) Si las dos personas de la condición están en el comité, los otros tres

miembros se elegirán de las ocho personas restantes de:
Así, hay 252-56= 196 comités en los que no están juntas las dos personas
peleadas.
c) Si las dos personas de la condición están en el comité, los tres restantes se
escogen de:
Los comités en donde la pareja no está son:
Luego, el total de comités con o sin la pareja son:

56+56= 112
57
Y la pareja siempre unida.
d) Existen diez maneras de elegir presidente y
Maneras de obtener su corte. Así habrá 10x126= 1260 comités de cinco

miembros, siendo uno de ellos su presidente.
Combinaciones con repetición. -
En este tipo de combinaciones se permite repetir objetos en una misma
combinación, por lo que el orden puede ser mayor que el número de objetos
dados.
La fórmula para determinar el número de las combinaciones con repetición que se
pueden formar con “n” objetos seleccionando “r” a la vez es:
Ejemplo 6.12
Formar las combinaciones con repetición hasta de orden tres de las letras a, b, c,
Solución
Combinaciones con repetición de orden 1:
a b c
aa bb cc
ab bc
ac
aaa bbb ccc
aab bbc
aac bcc
abb
58
abc
acc
Ejemplo 6.13
En una escuela mixta, de hombres y mujeres, se va a formar un comité de cinco
alumnos.
¿Cuántos comités diferentes se pueden formar, con respecto a su composición de
hombres y mujeres?
Solución
Para resolver el ejemplo deberán seleccionarse cinco de los objetos diferentes
(hombre y mujer). Luego el número de comités es:
2.3 INTRODUCCION A LA PROBABILIDAD
Eventos y espacio muestral

Introducción. -
En esta época en que nos ha tocado vivir, todo profesionista (ingeniero, médico,
químico, economista, etc.) se tiene que enfrentar al problema de construir modelos
que reflejen con mayor precisión el funcionamiento de un sistema real para
transformarlo o planear su operación. Una parte de este problema consiste en
medir el azar al cual están sujetas algunas variables que explican el sistema, y
esto lo hace a través del estudio de la teoría de probabilidad. Además, esta teoría
le sirve para cuantificar el riesgo al que se compromete cada vez que se toma una
decisión, y la ocurrencia del resultado que espera está sujeta al azar.
En ingeniería civil por lo general se desprecia la fricción, se suponen cuerpos
rígidos, se adoptan fluidos ideales, etc., para llegar a formulaciones simples del
problema (modelos matemáticos fáciles de analizar). A menudo estos modelos
son determinísticos, es decir, se asigna a cada variable independiente un valor y
una fórmula (un modelo) predice la variable dependiente.
Cuando se toma en cuenta la incertidumbre de los valores de las variables, los
modelos son probabilísticos y se sujetan a las reglas de análisis de la teoría de
probabilidades.
Para establecer el concepto de probabilidad se enuncia a continuación una serie
de definiciones.
Experimento. -
59
Es toda acción que se realiza con el fin de observar su resultado.
Como ejemplo se puede considerar el problema de determinar la carta de ruptura
a la tensión de una varilla de acero que se prueba con una máquina apropiada. En
este experimento la ACCION consiste en someter a la varilla a una prueba de
ruptura por tensión; después de aplicar cierta carga, la varilla falla por tensión, que
es el resultado de la acción; y la observación, la lectura en la máquina de la carga
que ocasionó la ruptura de la varilla.
Experimentos deterministas y aleatorios. -
Un experimento es determinista si se puede predecir con certeza su resultado
antes de que se presente. Por el contrario, el experimento es aleatorio-si no es
posible. Asegurar el resultado que se va a presentar al realizarlo. El ejemplo de la
prueba de la resistencia de la varilla y el tiro de una moneda corresponden a
experimentos aleatorios, también llamados PROBABILISTICOS. Mientras que si
se suelta un libro en el espacio a fin de determinar si flota en el espacio, se estrella
contra el techo o cae al suelo, corresponde a un experimento determinista.
Evento. –
Es todo resultado posible de un experimento aleatorio, como puede ser el que
caiga águila en el caso del tiro de una moneda o que la resistencia de la varilla
probada sea superior a-4000 Kg/cm2.
Evento elemental. -
Es aquel que contiene un solo elemento (resultado más simple). Por ejemplo, al
tirar un dado y observar el número de la cara que ve hacia arriba, los eventos
elementales serán: Cae 1, 2, 3, 4, 5 y 6.
Evento compuesto. -
O simplemente evento, es aquel que contiene dos o más elementos, o sea que es
cualquier resultado de un experimento aleatorio que pueda expresarse por medio
de varios eventos elementales. Por ejemplo, el evento cae par, del ejemplo
anterior, se expresa mediante los eventos elementales cae 2, cae 4, o cae 6.
Espacio de eventos o espacio muestral. –
Es el conjunto de todos los diferentes resultados posibles de obtener al realizar un
experimento aleatorio.
Un espacio de eventos cuyos elementos asumen valores no continuos (discretos)
se le llama Espacio De Eventos Discreto O Continuo, y tiene como
característica que sus elementos se pueden con tan o enumerar.
Si los resultados posibles varían en forma continua, es decir los elementos del
espacio de eventos no se pueden enumerar o contar, este se llama Espacio De
Eventos Continuo.
60
Podemos combinar eventos para formar nuevos eventos, utilizan do las
operaciones con conjuntos. Supóngase que A y B pertenecen - al mismo espacio
de eventos S.
a) A UB Es el evento que sucede si y sólo si A o B, o ambos suceden
b) A n B Es el evento que sucede si y solo si A y E suceden simultáneamente
c) Ac (complemento de A) es el evento que sucede si y sólo si A no
sucede.
Si dos o más eventos no tienen algún elemento en común o no - pueden ocurrir
simultáneamente se dice que son Mutuamente Exclusivos O Excluyentes.
Sea el caso del lanzamiento de un dado si A0 = {1,2,3} y A1 = {4,5,6}, entonces
A0 y A1 son mutuamente exclusivos ya que A0п A1 = Ø
2.3.1 DEFINICION Y EXPRESION
A cada elemento del espacio muestral de eventos de un experimento se le asigna

un número llamado MEDIDA DE PROBABILIDAD. A la teoría matemática de las
probabilidades no interesa la procedencia de estos números ni su significado; sólo
nos dice cómo usarlos de manera coherente. Pero el ingeniero que utiliza las
probabilidades para trabajar en sus modelos de situaciones reales debe estar
absolutamente seguro de lo que significa el conjunto de números que asigna, pues
los resultados de un análisis pueden ser útiles sólo si este insumo es significativo.
Existen 3 criterios de interpretación de la probabilidad
a) Interpretación clásica o a priori
b) Interpretación frecuencial o a posteriori
c) Interpretación subjetiva
a) La interpretación clásica de probabilidades indica que si n(A) es el número
de maneras IGUALMENTE PROBABLES, en el que puede ocurrir el evento A, y n
es-el número total de elementos (finito) del espacio de eventos correspondiente,
entonces la probabilidad de A es:
Ejemplo 7.1
Si se tienen en una urna cinco bolas rojas y quince blancas, y se va a seleccionar
al azar una de ellas, la probabilidad de que sea roja (evento A) es:
P (A)= 5/20= 1/4
61
Ya que A puede ocurrir de cinco n(A) = 5 maneras distintas e igualmente
probables, puesto que la extensión se realiza al azar, además, el total de
posibilidades es n(S) = 20.
b) Las frecuencias relativas son una explicación intuitiva satisfactoria de la
medida de probabilidad asignada a un punto muestral. Este criterio indica
que si un experimento se repite n veces, de los cuales n(A) veces se
observa el evento A, entonces la probabilidad de A es el límite de la
frecuencia relativa, n(A)/n, de ocurrencia de A, es decir:
Puesto que en la práctica el experimento no se puede repetir un número infinito de

veces, se acostumbra a utilizar la frecuencia relativa del evento A como
aproximación (estimación de P(A)).
Ejemplo 7.2
La probabilidad de que la precipitación pluvial en la cuenca del río Papaloapan
exceda los 70 centímetros el próximo año, basándonos en observaciones hechas
en los últimos 30 años es:
De las 30 observaciones hechas, se cuenta el número de veces en que la
precipitación pluvial excedió los 70 centímetros. (Supongamos que fueron 6).
P(B) = número de veces en que la precipitación excedió a 70 cm.
Número de veces en que se realizó el experimento
P(B) = 6/30 = 0.20
c) La probabilidad asignada a los posibles resultados de un experimento

también puede interpretarse como un conjunto de ponderaciones que
expresa la medida que hace el individuo de la verosimilitud relativa de los
resultados; es decir, que la probabilidad de un evento puede ser
simplemente una medida SUBJETIVA del grado de confianza que tiene
para un individuo una apreciación o predicción.
Ejemplo 7.3
¿Cuál es la probabilidad de que Pipino Cuevas recupere el campeonato mundial
welter, al enfrentarse próximamente al campeón mundial?
Interpretación subjetiva: Dependiendo de la persona que emita su opinión al
respecto.
62
P (c) = P (Cuevas gane)= 0.75
2.4 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES
Axiomas de probabilidad. –
La validez matemática de cualquier resultado derivado a través de la aplicación
correcta de la teoría axiomática de las probabilidades es cierta, sin importar como
interpreta el ingeniero el significado de la medida de probabilidad ni cuál fue su
origen, mientras la asignación de los pesos sea compatible con 3 axiomas
sencillos.
AXIOMA I.- La probabilidad de ocurrencia de un evento es un número, P(A), que
se le asigna a dicho evento, cuyo valor es menor o igual que uno.
0< P (A) < 1
AXIOMA II.- Si “S” es el espacio de eventos asociado a un experimento, entonces:
P (s) = 1
AXIOMA III.- La probabilidad, P (c), de la unión “C”, de dos eventos mutuamente
exclusivos, A y B, es igual a la suma de las probabilidades de estos, es decir.
P (A U B) = P (c) = P (A) + P (B)
De los axiomas anteriores deducimos los siguientes teoremas:
TEOREMA I: Si Ø es el conjunto vacío, entonces P (Ø) = 0
TEOREMA II: Si Ac es el complemento del evento A, entonces
P (Ac) = 1 – P(A)
TEOREMA III.- Si A es un subconjunto del evento B, entonces
P (A) < P (B)
La primera de las hipótesis significa que físicamente es posible construir y contar
cuantos eventos elementales hay en el espacio de eventos del experimento. La
segunda muestra que no hay ninguna preferencia sobre la ocurrencia de alguno o
algunos de los eventos elementales.
Entonces la probabilidad de A es:
Ejemplo 7.4
63
Sea el caso del tiro de un dado con sus caras numeradas del 1 al 6.
a) ¿Cuál es la probabilidad de que ocurra el evento cae un número par?
b) ¿Cuál es la probabilidad de que ocurra el evento cae 8?
c) ¿Cuál es la probabilidad de que ocurra el evento cae un número entre 0 y
7?
Solución
a) Si A es el evento cae par y S el espacio de eventos, o sea,
A= {2, 4, 6} y S= {1, 2, 3, 4, 5, 6}, entonces n(A) = 3 y n(S) = 6
Luego P (A) = 3/6 = ½= 0.5
Esto significa que en el 50 % de las veces caerá un número par al tirar el dado.
b) El evento cae 8 es un evento imposible, luego, si Ø representa dicho
evento, se tiene que n(Ø) = 0, y
Por lo tanto la probabilidad de que ocurra un evento imposible es cero.

c) Cae un número entre 0 y 7 es un evento seguro; luego, si S representa a
dicho evento, se tiene
Por lo tanto, la probabilidad de que ocurra un evento seguro es uno.

Ejemplo 7.5
Sean dos artículos escogidos al azar de un grupo de 12 de los cuales 4 son
defectuosos, hallar:
a) La probabilidad de que los 2 artículos sean defectuosos

b) La probabilidad de que los 2 artículos no sean defectuosos
c) La probabilidad de que por lo menos uno sea defectuoso.
SOLUCION
64
Existen C122 =66 maneras en que se pueden escoger dos artículos entre 12 (n=
66)
Existen C.24= 6 maneras en que se pueden escoger dos artículos defectuosos
entre cuatro defectuosos (A = 6)
Existen C28= 28 maneras en que se pueden escoger dos artículos no defectuosos
entre 8 no defectuosos (B = 28)
Ejemplo 7.6
En un examen de probabilidad y estadística, 4 alumnos obtuvieron calificación MB
(Muy bien), 10 B (Bien), 13 S (Suficiente) y 3 NA (No Aprobados). ¿Cuál es la
probabilidad de que un alumno seleccionado al azar para que pase al pizarrón a
resolver el examen después de que ha concluido, haya obtenido una nota de MB o
B?
Sean: M= evento obtener calificación de MB
B= evento obtener calificación de B
Los cuales son mutuamente excluyentes, entonces
P (M o B)= P (M U B)= P (M) + P (B)
65
Figura 7.4 Espacio De Eventos De Las Calificaciones De Un Examen
Solución
Hay cuatro eventos elementales en M y diez en B; el espacio de eventos está
determinado por el total de calificaciones, que son 30. Luego:
P (M U B) = 4/30 + 10/30= 14/30= 0.467
2.5 EVENTOS INDEPENDIENTES, DEPENDIENTES Y PROBABILIDAD

CONDICIONAL
Si A y B son dos eventos del espacio de eventos S, la probabilidad de que el

evento B ocurra con la condición de que previamente haya ocurrido el evento A,
se conoce como probabilidad condicional de B y se representa por P(B/A).
Al realizar el experimento, supóngase que ocurre el evento A y, una vez ocurrido
éste, se desea observar si también ocurrió el B. Puesto que ya ocurrió el evento A,
el evento B sólo puede ocurrir si tiene eventos elementales en A, que serían los de
la intersección A п B. Además, en ese momento el evento A es el espacio total de
eventos posibles, por lo que P (B/A) se puede calcular como:
66
Figura 7.5 Probabilidad Condicional
Relación que expresa la probabilidad condicional de B, dado que ocurrió A.

Ejemplo 7.7
En un monedero hay dos monedas de plata, una es de un peso y la otra de cinco
pesos; también hay dos monedas de oro, una de 50 pesos y la otra de 100. Si se
extraen al azar dos monedas sin reemplazo y la primera moneda es de plata,
¿Cuál es la probabilidad de que la segunda sea de oro?
Sean: P = evento sale moneda de plata en la primera extracción
O = evento sale moneda de oro en la segunda extracción
P1 = evento sale moneda de plata de un peso
P5 = evento sale moneda de plata de cinco pesos
O50= evento sale moneda de oro de cincuenta pesos
67
O100= evento sale moneda de oro cien pesos.
Solución
El espacio de eventos de este experimento está formado por los eventos

elementales siguientes:
De aquí se obtiene que: n (P п Q) = 4 y n (P) = 6
Luego la probabilidad de que la segunda moneda sea de oro, con la condición de

que la primera haya sido de plata, es:
Ejemplo 7.8
En el área de ingeniería civil, 25 % de los alumnos reprobaron estática, 15 %

reprobaron matemáticas y 10 % reprobaron las dos. Se selecciona un alumno al
azar.
i) Si reprobó matemáticas ¿Cuál es la probabilidad de que haya reprobado

estática?
ii) Si reprobó estática ¿Cuál es la probabilidad de que haya reprobado
matemáticas?
iii) ¿Cuál es la probabilidad de que reprobó estática o matemáticas?
68
Solución
Sea E = estudiantes que reprobaron estática
M = estudiantes que reprobaron matemáticas
Entonces: P (E) = 0.25; P (M)= 0.15 y P (E п M)= 0.10
i) P (E/M) = P (E п M)= 0.10= 2/3

P (M) 0.15
ii) P (M/E) = P (M E)= 0.10= 2/5
P (E) 0.25
iii) P (E U M)= P (E) + P (M) – P (E п M)
P (E U M)= 0.25 + 0.15 – 0.10= 0.30 = 3/10
Teorema De La Multiplicación. -
La expresión de la probabilidad condicional puede escribirse como:
P(A п B)= P (A) P (B/A)
Esta expresión se conoce como teorema de la multiplicación de probabilidades, e

interpreta la probabilidad de que ocurran simultáneamente los eventos A y B.
Generalizando tenemos:
Dónde: Ai, i= 1, 2, 3, ……, n, son “n” eventos del espacio de eventos S.
Dados los eventos A y B del espacio de eventos S, se dice que B es

independiente de A si:
P (B/A) = P (B)
Lo que significa que el valor de la probabilidad de que ocurra B no es influida por

la ocurrencia de A. Por lo tanto:
P (A п B)= P (A) P (B)
Expresión que se conoce como TEOREMA DE MULTIPLICACION DE EVENTOS

INDEPENDIENTES. Se acostumbra también decir que dos eventos A y B del
espacio de eventos S son INDEPENDIENTES si y sólo si:
69
P (B/A)= P (B)
Generalizando:
En donde: Ai, i= 1, 2, 3 , ….., n, son eventos independientes del espacio de

eventos S.
2.6 TEOREMA DE BAYES
El teorema de Bayes parte de una situación en la que es posible conocer las
probabilidades de que ocurran una serie de sucesos Ai.
A esta se añade un suceso B cuya ocurrencia proporciona cierta información,
porque las probabilidades de ocurrencia de B son distintas según el suceso Ai que
haya ocurrido.
Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos
indica como modifica esta información las probabilidades de los sucesos Ai.
Ejemplo:
Si seleccionamos una persona al azar, la probabilidad de que sea diabética es
0,03. Obviamente la probabilidad de que no lo sea es 0,97.
Si no disponemos de información adicional nada más podemos decir, pero
supongamos que al realizar un análisis de sangre los niveles de glucosa son
superiores a 1.000 mg/l, lo que ocurre en el 95% de los diabéticos y sólo en un 2%
de las personas sanas.
¿Cuál será ahora la probabilidad de que esa persona sea diabética?
La respuesta que nos da el teorema de bayes es que esa información adicional
hace que la probabilidad sea ahora 0,595.
Vemos así que la información proporcionada por el análisis de sangre hace pasar,
la probabilidad inicial de padecer diabetes de 0,03, a 0,595.
Evidentemente si la prueba del análisis de sangre hubiese sido negativa, esta
información modificaría las probabilidades en sentido contrario. En este caso la
probabilidad de padecer diabetes se reduciría a 0,0016.
2.7 VALOR ESPERADO O ESPERANZA MATEMATICA
70
Descripción de una variable aleatoria discreta
De la misma manera como ocurre con las colecciones de datos muéstrales y
poblacionales, con frecuencia es útil describir una variable aleatoria en términos
de su media (véase la sección 3.2) y de su varianza o desviación estándar (véase
la sección 4.6). La media (a largo plazo) de una variable aleatoria X se llama valor
esperado y se denota por E(X). En el caso de una variable aleatoria discreta, la
media es el promedio ponderado de todos sus posibles valores numéricos
empleando las probabilidades respectivas como factores de ponderación. Debido
a que la suma de los factores de ponderación (probabilidades) es 1.0, la fórmula
(3.3) se puede simplificar, y el valor esperado en el caso de una variable aleatoria
discreta es
En la tabla 6.2 se presenta el cálculo, de acuerdo con los datos de la tabla 6.1, del
valor esperado de la variable aleatoria. El valor esperado es 5.66 camionetas.
Observe que el valor esperado de una variable discreta puede ser un valor
fraccionario, ya que representa el valor promedio a largo plazo, y no el valor
específico de alguna observación dada.
La varianza de una variable aleatoria X se denota por V(X); esta varianza se
calcula en relación con E(X) como media de la distribución de probabilidad. La
71
forma general, la fórmula de las desviaciones para el cálculo de la varianza de una
variable aleatoria discreta es
La fórmula para el cálculo de la varianza de una variable aleatoria discreta, en

donde no se requiere determinar las desviaciones respecto de la media, es
La hoja de cálculo para la varianza de la demanda de alquiler de las camionetas

se presenta en la tabla 6.3; aquí se usa la fórmula para cálculo (no la de las
desviaciones). Como se indica en seguida, el valor de la varianza es 1.74.
Tabla 6.3 Hoja de cálculo para la varianza de demanda de camionetas
72
Igual que en la sección 4.6, tratándose de poblaciones o de muestras, la
desviación estándar de una variable aleatoria es simplemente la raíz cuadrada de
la varianza:
δ= √V(X)
Una ventaja de la desviación estándar es que se expresa en las mismas unidades
que la variable aleatoria y no en unidades al cuadrado.
La desviación estándar de la demanda en el alquiler de las camionetas es:
δ= √V(X)= √1.74= 1.32 camionetas
73
¿Sabías que…
En teoría de la
probabilidad y
estadística, la
distribución de
probabilidad de
una variable
aleatoria es una
función que
UNIDAD 3 asigna a cada

suceso definido
sobre la variable
aleatoria la
TIPOS DE probabilidad de
que dicho
DISTRIBUCIONES, suceso ocurra.
VARIABLES
ALEATORIAS,
DISCRETAS Y
CONTINUAS
74
3. TIPOS DE DISTRIBUCIONES, VARIABLES
ALEATORIAS DISCRETAS Y CONTINUAS.
3.1 BINOMIAL
Extraer un solo componente de una población y determinar si está o no defectuoso

es ejemplo de un ensayo de Bernoulli. En la práctica, es posible extraer varios
componentes de una gran población y contar el número de elementos
defectuosos. Esto implica realizar diversos ensayos de Bernoulli independientes y
contar el número de éxitos. El número de éxitos es variable aleatoria, que tiene
una distribución binomial. Ahora se presenta una descripción formal de la
distribución binomial. Suponga que se lleva a cabo una serie de n ensayos de
Bernoulli, cada uno con la misma probabilidad de éxito p. Además, suponga que
los ensayos son independientes; esto es, que el resultado de un ensayo no influye
en los resultados de alguno de los otros ensayos. Sea la variable aleatoria X igual
al número de éxitos en n ensayos, entonces X tiene la distribución binomial con
parámetros n y p.
La notación es X — Bin(n„p). X es una variable aleatoria discreta y sus posibles
valores son 0, 1...., n.
Recuerde, de la discusión de independencia en la sección 1.1, que cuando se
toma una muestra de una población finita tangible, es posible tratar a los
elementos de la muestra como independientes si es que la población es muy
grande en comparación con el tamaño muestral. De lo contrario, los elementos de
la muestra no serían independientes. En algunos casos el objetivo al extraer una
muestra suele ser clasificar a cada elemento de la muestra en una de dos
categorías. Por ejemplo, puede extraerse cierto número de elementos de una
población y clasificar a cada uno como defectuoso o no. En estos casos cada
elemento de la muestra presenta un ensayo de Bernoulli, con una categoría
contada como éxito y la otra como fracaso. Cuando la población de elementos es
grande comparado con el número de elementos de la muestra, esos ensayos son
independientes y, por razones prácticas, su número de éxitos tiene distribución
binomial. Sin embargo, cuando el tamaño de la población no es tan grande, en
comparación Con la muestra, los ensayos no son independientes y su
número de éxitos no tiene distribución binomial. La regla general es que, sí
el tamaño muestral es de 5% o menos de la población, se puede emplear
la distribución binomial
3.1.1 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR
Ahora se deducirá la función de masa de probabilidad de una
variable aleatoria binomial con un ejemplo. En una moneda
específica existe una probabilidad de 0.6 de que salga "cara". Se
lanza a l a i re l a mo n e d a t re s v e ce s. Se a X e l n ú me ro d e ca r a s .
E n to n ce s X~ Bi n (3 , 0 .6 ) . Se ca l cu lará P(X = 2).
75
H a y t r e s a r re g l o s c o n d o s " c a r a s" e n l o s t r e s l a n z a mi e n t o s d e
u n a m o n e d a , H H T , H T H y THE. Primero se calcula la probabilidad
de HHT. Este evento constituye una secuencia de eventos
independientes: H en el primero, H en el segundo, y T en el tercer
lanzamiento, resp e c ti va me n te . Po r s e p a ra d o se c o n o ce l a s
p ro b a b i l i d a d e s d e ca d a u n o d e e l l o s:
P(H en el primer lanzamiento) = 0.6, P(H en el segundo) = 0.6,

P(T en el tercero) = 0.4
Como consecu enci a de qu e lo s even to s son ind epen dien te s, la

pro babil idad de que tod os se prese nten es igual al pro ducto de
su s pro babil idad es (ecu aci ón 2_2 0 de la secció n 2.3). P or tanto,
P (H H T ) = ( 0 . 6 ) ( 0 . 6 ) ( 0 . 4 ) = ( 0 . 6 ) 2 ( 0 . 4 ) 1
D e f o r ma si mi l a r, P (I TT FI ) = (0 .6 )( 0 . 4 ) (0 . 6 ) = ( 0 . 6 ) 2 (0 _ 4 ) 1 y
P ( TH H ) = (0 . 4 ) (0 .6 )( 0 . 6 ) = (0 .6 ) 2 (0 .4 ) 1 . Es fá cil ve r qu e to do s l o s
di fe re n te s arre g lo s d e do s "ca ra s" y u na " cru z" ti e ne n la mi sma
p ro b a bi l id a d . Ah o ra
P(X = 2) = P(HFIT o HTH o TIII-I)
= P(HHT) P(HTH) P(THH)
= (0.6) 2 (0.4) 1 +(0.6) 2 (0.4) 1 + (0.6) 2 (0.4
= 3(0.6) 2 (0.4) 1
A l e xa mi n a r e s te re su l ta d o se o b se rv a q u e e l n ú me ro 3
re p re se n ta e l n ú me ro d e a r re g l o s d e . d o s éxi to s (" ca ra " ) y u n
fra ca so (" cru z" ), 0 .6 e s la p ro ba b il i d ad de é xi to p , e l e xpo n e n te 2
e s e l n ú me r o d e é x i t o s , 0 .4 e s l a p ro b a b i l i d a d d e fr a ca so 1 - p y e l
e xp o n e n te 1 e s e l n ú me ro d e fracasos.
Ahora se puede generalizar este resultado para generar una fórmula
de la probabilidad d e x é xi to s en n en sa yo s de Be rn o u ll i
in d ep e n di e n te s co n p rob a b il i da d d e é xi to p , en té rmi n o s de x,n y
p . E n o tra s p a la b ra s, es po si bl e ca l cu l a r P(X=x) do n de
X ~B in (n ,p ). se pu e d e ve r q ue P(X = x) (número de arreglos de x
éxitos en n ensayos) - p x (1 - p)n
ahora todo lo que se necesita hacer es una expresión del número de
arreglos de x éxitos en n ensayos. Para describir este número, se necesita
la notación factorial. Para cualquier positivo a, la cantidad n! (que se lee
como "a factorial") es el número
(n)(n - l)(n - 2)…… (3)(2)(1)
76
Asimismo, se define 0! = 1. El número de arreglos de x éxitos en n ensayos
es n!/x!(n – x)!
(En la sección 2.2 se presentó una deducción de este resultado.) Ahora se
puede definir l a f u n c i ó n d e m a s a d e p r o b a b i l i d a d p a r a u n a
variable aleatoria binomial.
La figura 4.2 muestra los histogramas para las funciones de masa de
probabilidad.
Figura 4.2 a) histograma de probabilidad Bin(10,0.4), b) histograma de

probabilidad Bin(20,0.1)
Ejemplo:
Se lanza al aire ocho veces un dado. Determine la probabilidad de que no
salgan más de dos números seis.
Solución
77
Cada lanzamiento del dado es un experimento Bernoulli con una probabilidad
de éxito de 1/6. Sea X el número de seises en los ocho lanzamientos. Entonces
X — Bin(8, 1/6). Se necesita determinar a P(X 2). Con el uso de la función de
masa de probabilidad,
La tabla A.1 (en el Apéndice A) presenta probabilidades binomiales de la formula

PCX < x) para n 20 y valores seleccionados de p. Los ejemplos 4.9 y 4.10
muestran el uso de esta tabla.
Una variable aleatoria binomial constituye la suma
de variables aleatorias de Bernoulli
Suponga que se realizan n ensayos de Bernoulli independientes, cada uno con

probabilidad de éxito p. Sean Y1..., Yn definidas de la siguiente manera: n = 1
si el i-ésimo experimento da como resultado un éxito, y n = O, de otro modo.
Entonces cada una de las variables aleatorias y sigue una distribución
Bernoulli(p). Ahora, sea que X represente el número de éxitos en los n
ensayos. Entonces, X — Bin(n, p). Puesto que cada Y,-es 0 o 1, la suma Y i
+ • •Yn, es igual al número de los Y que tienen el valor 1, que es el número
de éxitos en los ti ensayos. Por tanto, X = Y1+- -+ Yn. Esto último
demuestra que una variable aleatoria binomial se puede expresar como la
suma de variables aleatorias de Bernoulli. Dicho en otro modo, extraer un
solo valor de una población Bin(n, p) equivale a extraer una muestra de ta-
maño n de una población Bernoulli(p), y luego sumar los valores de la
muestra.
L a media y varianza de una variable aleatoria binomial
Es fácil calcular la media de una variable aleatoria binomial. Por ejemplo, si
se lanza al aire una moneda durante diez veces, se espera ver, en
promedio, cinco veces "cara ”. El número cinco proviene de la
78
multiplicación de la probabilidad de éxito (0.5) por elementos (10). Este
método generalmente funciona. Si se realizara n ensayos de Bernoulli, cada
uno con una probabilidad de éxito p, el número promedio de éxitos es np,
por consiguiente si X — Bin(n, p), entonces µx=np. Se puede comprobar
esta situación cuando se observa que X es la suma de n variables de
Bernoulli, cada una con media p. Por tanto, la una de las medias de
variables aleatorias de Bernoulli que la componen, que Se puede calcular a
σ²× al observar que X es la suma de variables aleatorias independientes de
Bernoulli y recordando que la varianza de una variable aleatoria Bernoulli
p(1 - p) la varianza de X es la suma de las varianzas de las variables
integran, que es igual np(1 — p).
Resumen
Si X — Bin(n, p), entonces la media y la varianza de X están dadas por
lux = nP (4.5)
2 = nP(1 p) (4.6)
Con el uso de la función de masa de probabilidad binomial (ecuación 4.4), se

puede, en principio, calcular la media y la varianza de una variable aleatoria
binomial mediante las definiciones de la media y la varianza de una variable
aleatoria discreta (ecuaciones 2.29 y 2.30 en la sección 2.4). Estas expresiones
implican sumatorias que son tediosas de evaluar. Es más sencillo considerar una
variable aleatoria binomial como una suma de variables de Bernoulli aleatorias
independientes.
Uso de una proporción muestral para estimar la probabilidad de éxito
En muchos casos no se conoce la probabilidad de éxito p asociada con cierto
ensayo de Bernoulli, y se desea estimar su valor. Una foiina natural de esto último
consiste en realizar experimentos independientes n y contar el número X de éxitos.
Para estimar la probabilidad de éxito p se calcula la proporción muestral p.
Esta notación sigue un patrón que es importante conocer. La probabilidad de éxito,

que se desconoce, está representada por p. La proporción muestral, la cual se
conoce, se representa por 79. El "sombrero" (^) indica que 73 se utiliza para
estimar un valor desconocido p.
Ejemplo:
Un ingeniero que supervisa el control de calidad está probando la calibración de
una máquina que empaca helado en contenedores. En una muestra de 20 de
79
éstos, tres no están del todo llenos. Estime la probabilidad p de que la máquina
no llene bien un contenedor.
Solución
La proporción muestral de contenedores no llenos es P = 3/20 = 0.15. Se estima
que la probabilidad p de que la máquina no llene bien un contenedor es también
igual a 0.15.
Incertidumbre en una proporción muestral
Es importante considerar que la proporción muestral P es sólo una estimación de
la probabilidad de éxito p, y que, en general, no es igual a p. Si se tomara otra
muestra, probablemente el valor de P sería diferente. Es decir, hay incertidumbre
en 73. Para que P sea una estimación útil, se debe calcular su sesgo y su
incertidumbre. Ahora se hace esto. Sea n el tamaño muestral y X el número de
éxitos, donde X — Bin(n, p).
El sesgo es la diferencia µp, — p. En virtud de que p=X/n, se tiene,
a partir de la ecuación (2.41), (de la sección 2.5) que
Debido a que µp = P*p, no es sesgado; en otras palabras, su sesgo es 0.

La incertidumbre es la desviación estándar. A partir de la ecuación (4.6) la
desviación estándar de X es σx=√ np(1−p). Puesto que p= X/n, se tiene a partir
de la ecuación (2.43) (de la sección 2.5) que
3.1.2 GRAFICA
¿Cómo se construye una gráfica de distribución de probabilidad binomial?

Para construirla se debe conocer:
1) el número de ensayos
2) la probabilidad de éxito de cada ensayo
80
por ejemplo, si en un examen al término de un seminario ejecutivo consiste de 20
preguntas de opción múltiple, el número de ensayos es 20. Si cada pregunta tiene
cinco opciones y sólo una es la correcta, la probabilidad de éxito para una persona
sin conocimiento del tema en cada ensayo será de 0.20. Por lo tanto, la probabilidad
es 0.20 de que una persona sin conocimiento del tema acierte la respuesta
correcta. Asimismo, se cumplen las condiciones de la distribución de probabilidad
binomial arriba enunciadas. La distribución de probabilidad binomial se representa
con el modelo matemático:
DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL P(x) = ,f)„, nx(1 n)" - x
[5-31
Donde
C denota una combinación
n es el número de ensayos
x es el número de éxitos
p es la probabilidad de éxito de cada ensayo
Ejemplo:
Cada día, Allegheny Airlines tiene cinco vuelos desde Pittsburgh al aeropuerto
regional de Bradford, Pensilvania. Suponga que la probabilidad de que alguno de los
vuelos se retrase es de 0.20. ¿Cuál es la probabilidad de que ninguno de los vuelos
se retrase el día de hoy? ¿Cuál es la probabilidad de que exactamente uno de los
vuelos se retrase este día?
Es posible utilizar la fórmula (5-3). La probabilidad de que un vuelo en particular se
retrase es de 0.20, de modo que sea p = 0.20. Hay cinco vuelos, de modo que rt =
5, y x se refiere al número de éxitos. En este caso, un "éxito" es un avión que llega
tarde. Debido a que no hay llegadas con retraso x = 0.
P(0) = „C),((p)(1 - p)n-x
5 C0(.02)°(1 - (1)(1)(.3277) = 3277
La probabilidad de que hoy llegue tarde exactamente uno de los cinco vuelos es
0.4096, que se encuentra mediante
P(1) = nCx(p)x(1 - x
= 5 C1 (.201 (1 - .20)5-1 (5)(.20)(.4096) = .4096
La distribución de probabilidad completa se muestra en la ilustración 5-2.
Ilustración 5-2 Distribución de probabilidad binomial para u = 5, p =

0.
81
Número de vuelos con
probabilidad de retraso:
.3277
1 .4096
2 .2048
3 .0512
4 .0064
5 .0003
Total 1.000
Diagrama 5-2 Distribución de

probabilidad binomio.' para
n= 5, p = 0.20
Los valores de la variable aleatoria en la ilustración 5-2 se muestran en el diagrama

5-2. Observe que la distribución de los vuelos que llegan tarde tiene un sesgo
positivo
Tablas de probabilidad binomial
Una distribución de probabilidad binomial es una distribución teórica que como,
muestra el ilustrado, puede calcularse mediante una fórmula. Sin embargo,
excepto por los que involucran un valor pequeño de n (por ejemplo, n = 3 o 4), los
cálculos pueden ser bastante tediosos. Como ayuda, se ha desarrollado un amplio
cuadro que da las probabilidades de 0, 1, 2, 3, . . . éxitos, para varios valores den y
de p. Este cuadro se encuentra en el apéndice A, y una pequeña parte del mismo,
para el siguiente ejemplo, se encuentra en la ilustración 5-3.
Ilustración 5-3
x
.05
.1 .2 .3 .4 .5 .6 .7 .8
.9
o .735 .531 .262. .118 .047 .016 .004 .001 .000 .00
1 .232 .354 .393 .303 .187 .094 .037 .010 . .000
82
2 .031 .098 .246 .324 .311 .234 .138 .060 . .001
3 .002 .015 .082 .185 .276 .313 276 .185 . .015
4 .000 .001 .015 .060 .138 234 .311 324 246 .096
5 .000 .000 .002 .010 .037 .094 .187 .303 . .354
6 .000 .000 .000 .001 .004 .016 .047 .118 . .531
3.2 LA DISTRIBUCIÓN DE POISSON

La distribución de Poisson se utiliza con frecuencia en el trabajo científico. Una
manera de considerarla es como una aproximación de la distribución binomial
cuando n es grande y p pequeña. Esto último se muestra con un ejemplo.
Una masa contiene 10 000 átomos de una sustancia radiactiva. La
probabilidad de que cierto átomo decaiga en un periodo de un minuto es
de 0.0002. Sea X el número de átomos que decae en un minuto. Se puede
considerar a cada átomo como un ensayo de Bernoulli, en los que el éxito
ocurre si el átomo decae. Por tanto, X es el número de éxitos en 10 000
ensayos de Bernoulli independientes, cada uno con probabilidad de éxito de
0.0002, de tal forma que la • distribución de X es Bin(10 000, 0.0002). La
media de X es µx = (10 000)(0.0002) = 2.
Otra masa contiene 5 000 átomos y cada uno de éstos tiene probabilidad de
0.0004 de decaer en un intervalo de un minuto. Sea Y el número de átomos
de esta masa que decae en un minuto. Siguiendo la lógica del párrafo
anterior, Y — Bin(5 000, 0.0004) y y = (5 000) (0.0004) = 2.En cada uno de
estos casos, el número de ensayos a y la probabilidad de éxito p son di-
ferentes, pero el número promedio de éxitos, que es igual al producto np,
es el mismo. Ahora suponga que se quiere calcular la probabilidad de que
sólo tres átomos decaigan en un minuto para cada una de estas masas.
Mediante la función de masa de probabilidad binomial, se calcula de la
siguiente manera:
Estas probabilidades son casi iguales entre sí. Aunque a partir de la fórmula de
la función de masa de probabilidad binomial esto no es obvio, cuando n es
grande y p es pequeña la función de masa depende por completo de la media
np, y muy pocos de los valores específicos de n y p. Por consiguiente, se puede
aproximar la función de masa binomial con una cantidad que dependa sólo del
producto np. Específicamente, si n es grande y p es pequeña, y X = np, se
puede demostrar mediante métodos avanzados que para todas las x,
83
Esto conduce a la definición de una nueva función de probabilidad,
denominada función de masa de probabilidad de Poisson, que se define
mediante
Para las masas radiactivas descritas al inicio de esta sección, se utiliza la
función de masa de Poisson para aproximar a P(X = x) o P(Y = x) sustituyendo a

X = 2 en la ecuación (4.9). La tabla 4.1 muestra que la aproximación es
excelente.
Tabla 4.1 Ejemplo de una aproximación de Poisson a la función de masa de

probabilidad binomial*
P(X = x), P(Y = x), Aproximación

x X ^, Bin (10 000,0.0002) Y ^ Bin (5 000,0.0004) de Poisson
Poisson (2)
0 0.135308215 0.135281146 0.135335283

1 0.270670565 0.270670559 0.270670566
2 0.270697637 0.270724715 0.270670566
3 0.180465092 0.180483143 0.180447044
4 0.090223521 0.090223516 0.090223522
5 0.036082189 0.036074965 0.036089409
6 0.012023787 0.012017770 0.012029803
7 0.003433993 0.003430901 0.003437087
8 0.000858069 0.000856867 0.000859272
9 0.000190568 0.000190186 0.000190949
Cuando n es grande y p pequeña, la función de masa de probabilidad Bin(n, p)

también se aproxima mediante la función de masa de probabilidad de Poisson (10
(ecuación 4.9), con X, = np. Aquí X - Bin(10 000, 0.0002) y Y - Bin(5 000,
0.0004), por lo que X. = np = 2, y la aproximación de Poisson es Poisson(2).
84
3.3 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTANDAR
Para calcular la media y la varianza de una variable aleatoria de Poisson, se
emplea la función de masa de probabilidad junto con las definiciones dadas por las
ecuaciones (2.29) y (2.30) (de la sección 2.4). Al final de esta sección se muestran
deducciones rigurosas de la media y de la varianza con este método. Aquí se
presenta un enfoque intuitivo. Si X — Poisson(?) se puede considerar a X como una
variable aleatoria binomial con n grande, p pequeña y np = X. Dado que la media
de una variable aleatoria binomial es np, se tiene que la media de una variable
aleatoria de Poisson es X. La varianza de una variable aleatoria binomial es np(1
— p). Puesto que p es muy pequeña, se puede reemplazar 1 — p con 1, y concluir
que la varianza de una variable aleatoria de Poisson es np = 2L.. Observe que esta
última es igual a su media.
La figura 4.3 muestra histogramas de probabilidad para las funciones de masa de
probabilidad de Poisson (1) y de Poisson(10).Uno de los primeros usos

industriales de la distribución Poisson se aplicó en la fabricación de cervezas. Un
paso fundamental en dicho proceso es la adición de la cultura de la levadura para
preparar la malta para la fermentación. Se mantiene a las células vivas de
levadura suspendidas en un medio líquido. Debido a que las células están vivas,
85
su concentración en e,1 medio cambia con el tiempo. Por tanto, antes de que se
agregue la levadura, se necesita calcular la concentración de células de levadura
por unidad en el volumen de la suspensión, para asegurarse de que se añadió la
cantidad correcta.
Hasta principios del siglo xx, lo anterior consistía un problema para los fabricantes
de cerveza. Ellos estimaban la concentración al extraer un pequeño volumen de la
suspensión y contar las células de levadura en ésta utilizando un microscopio. Por
supuesto que las estimaciones determinadas así estaban sujetas a la incertidumbre,
pero nadie sabía cómo calcular ésta. Por tanto, nadie sabía en cuánto podía diferir
la concentración de la muestra de la concentración verdadera.
William Sealy Gosset, un joven de 25 años fue contratado por la compañía

cervecera Guinness, de Dublín, Irlanda, y descubrió en 1904 que el número de
células de levadura en el volumen de la suspensión de una muestra seguía una
distribución de Poisson. Entonces desarrolló métodos para calcular la
incertidumbre. El descubrimiento de Gosset no sólo le permitió a Guinness hacer
un producto más consistente, sino que demostró que la distribución de Poisson
puede tener aplicaciones importantes en muchas situaciones. Gosset quería
publicar su resultado, pero sus jefes consideraron que su descubrimiento era
información privada y se lo prohibieron. De todos modos, Gosset lo publicó, pero
para esconder este hecho a sus jefes, utilizó el seudónimo "Estudiante". En el
ejemplo 4.17 se seguirá una lógica de razonamiento que conduce al resultado de
"Estudiante". Antes de esto, se mencionará que cuatro años después de publicar
ese resultado, hizo otro descubrimiento que resolvió uno de los problemas
pendientes más importantes de la estadística, y que ha tenido, desde entonces,
86
una profunda influencia en los trabajos de casi todos los campos de la ciencia.
Ese resultado se analiza en la sección 5.3.
Ejemplo 4.17:
Unas particulas (por ejemplo, células de levadura) están suspendidas en un medio
liquido con concentración de diez particulas por ml. Se agita por completo un volumen
grande de la suspensión y después se extrae 1 ml. ¿ cual es la probabilidad de que
solo se extraigan ocho partículas?
Solución
Siempre y cuando el volumen extraído sea una fracción pequeña del total, la
solución a este problema no depende del volumen total de la suspensión, sino sólo
de la concentración de partículas en éste. Sea V el volumen total de la suspensión,
en mL. Entonces, el número total de partículas en la suspensión es 10V. Considere
a cada una de éstas como un ensayo de Bernoulli. Una partícula tiene "éxito" si es
retirada. Ahora, se extrae 1 mL del total de V mL. Por consecuencia, la cantidad que
se retirará representa 1/V del total, de ahí que cada partícula tenga una
probabilidad de 1/V de ser retirada. Sea X el número de partículas extraídas. De
este modo, X representa el número de éxitos en 10V ensayos de Bernoulli, cada
uno con probabilidad de éxito de 1/V. Por tanto, X -- Bin(10V, 1/V). Puesto que Ves
grande, 10V es grande y 1/V es pequeño. Por consiguiente, en una aproximación
muy cercana, X — Poisson(10). Se calcula P(X = 8) con la función de masa de
probabilidad Poisson: P(X = 8) = e- 10108/8! = 0.1126.
Uso de la distribución de Poisson para estimar una razón

A menudo se realizan experimentos para estimar una razón X que represente la
media del número de eventos que ocurren en una unidad de tiempo o espacio. En
estos experimentos se cuenta el número de eventos X que ocurre en t unidades, y
se estima la razón X con la cantidad ʎ= X/t (Observe que en virtud de que la
cantidad X/t se utiliza para estimar X, ésta se denota como ʎ.' Si los números de
eventos en intervalos disjuntos son independientes, y si no es posible que los
eventos ocurran simultáneamente, entonces X sigue una distribución de Poisson.
Al proceso que da como resultado dichos eventos se le denomina proceso de
Poisson. Puesto que la media del número de eventos que ocurre en t unidades
de tiempo o espacio es igual a ʎt, X — Poisson(ʎt).
87
3.4 GRÁFICA
Es importante darse cuenta de que la razón estimada o concentración ñ sólo

representa una estimación de la verdadera razón o concentración X. En general,
1, no es igual a X. Si se repitiera el experimento, probablemente el valor de?
sería diferente. En otras palabras, hay incertidumbre en -21. Para que X sea una
estimación útil, se debe calcular su sesgo e incertidumbre. Los cálculos son
similares a los de la proporción muestral presentados en la sección 4.2. Sea X el
número de eventos contados en t unidades de tiempo o espacio, y suponga que
X — Poisson(Xt).
El sesgo es la diferencia /II — X. Dado que 2. = X/t, se tiene a partir de la
ecuación (2.41) (de la sección 2.5) que
Puesto que µ ^λ =ʎ, ^λ no es sesgado la incertidumbre es la desviación estándar σ ^λ .
Dado que ^λ = X/t, se tiene a partir de la ecuacion (2.43) (de la sección 2.5) que σ ^λ =
σX/t. debido a que X~poisson(ʎt), se tiene a partir de la ecuación (4.11) que σx=
√ ʎ t por consecuencia,
Para el caso de las partículas en suspensión, o eventos de decaimiento radiactivo,

se conocen los principios fundamentales de la física que rigen estos procesos, donde
basándose en los primeros principios, podría demostrarse que la distribución del
número de eventos es de Poisson. Existen muchos casos en los que la evidencia
empírica sugiere que la distribución de Poisson es adecuada, pero las leyes que
rigen los procesos no son comprendidas bien para realizar una posible deducción
88
rigurosa. Entre los ejemplos está el número de visitas a un sitio web, el número de
accidentes de tráfico en una intersección y el número de árboles en una sección
del bosque.
Deducción de la media y la varianza de una variable aleatoria de Poisson

Sea X — Poisson(ʎ). Se demostrará que µ=ʎ y σ²x=ʎ. Utilizando la definición de
la inedia poblacional para una variable aleatoria discreta (ecuación 2.29 de la
sección 2.4):
Ahora la sumatoria de ∑ x ∞=0 e−ʎ ʎ x /x! es la suma de la función de masa de
probabilidad de Poisson(ʎ) sobre todo sus valores posible. Por tanto ∑ x ∞=0 e−ʎ ʎ x
/x! = 1, por lo que, µx = ʎ
Se emplea la ecuación (2.31) (de la sección 2.4) para demostrar que σ²x= ʎ.
89
Al sustituir x(x – 1) + x para x² y ʎ para µx en la ecuación, se obtiene
Ahora, x( x – 1 ) = 0 si x = 0 o 1, y ∑ x ∞=0 e−ʎ ʎ x /x!= µx = ʎ.

Por consiguiente, se puede comenzar por sumar el lado derecho de la ecuación en
∞
x=2, y sustituir ʎ por ∑ −ʎ x
/x! se obtiene
x =0 e ʎ
Ejercicios
1. Sea X — Poisson (4). Determine

a) P(X = 1)
b) P(X = 0)
c) P(X < 2)
d) P(X > 1)
90
e) µx
f) σx
2. La concentración de partículas en una suspensión es 2 por mL. Se agita por

completo la concentración, y posteriormente se extraen 3 mL. Sea X el número
de partículas que son retiradas. Determine
a)P(X = 5)
b)P(X 2)
c) P(X > 1)
d)µx
e) σx
3. Suponga que 0.03% de los contenedores plásticos producidos en cierto proceso
tiene pequeños agujeros que los dejan inservibles. X representa el número de
contenedores en una muestra aleatoria de 10 000 que tienen este defecto.
Determine
a) P(X = 3)
b) P(X .5_ 2)
c) P(1 5- X < 4)
d) µx
e) σx
4. Uno de cada 5 000 individuos en una población porta cierto gen defectuoso. Se
estudia una muestra aleatoria de 1 000 individuos.
a) ¿Cuál es la probabilidad de que sólo uno de los individuos de la

muestra porte el gen?
b) ¿Cuál es la probabilidad de que ninguno sea portador?
c) ¿Cuál es la probabilidad de que más de dos individuos porte el gen?
d) ¿Cuál es la media del número de individuos de la muestra que porta
el gen?
e) ¿Cuál es la desviación estándar del número de individuos portadores
de gen?
5. El número de mensajes recibidos por el tablero computado de anuncios es

una variable aleatoria de Poisson con una razón media de ocho mensajes por
hora.
91
a) ¿Cuál es la probabilidad de que se reciban cinco mensajes en
una hora?
b) ¿Cuál es la probabilidad de que se reciban diez mensajes en 1.5
horas?
c) ¿Cuál es la probabilidad de que se reciban menos de tres mensajes
en 1½ horas?
6. Cierto tipo de tablero de circuitos contiene 300 diodos. cada uno tiene una
probabilidad p = 0.002 de fallar.
a) ¿Cuál es la probabilidad de que fallen exactamente dos diodos?

b) ¿Cuál es la media del número de diodos que falla?
c) ¿Cuál es la desviación estándar del número de diodos que falla?
d) Un tablero funciona si ninguno de sus diodos falla ¿Cuál es la
probabilidad de que funcione un tablero?
e) Se envían cinco tableros a un cliente. ¿Cuál es la probabilidad de que
cuatro o más de ellos funcione?
7. Una variable aleatoria X tiene una distribución binomial una variable aleatoria Y
tiene una distribución de Poisson Tanto X como Y tienen medias iguales a 3. ¿Es
posible determinar qué variable aleatoria tiene la varianza más grande? Elija
una de las siguientes respuestas:
a) Sí, X tiene la varianza más grande.

b) Sí, Y tiene la varianza más grande.
c) No, se necesita conocer el número de ensayos, n, para X
d) No, se necesita conocer la probabilidad de éxito, p, para X.
e) No, se necesita conocer el valor ʎ para Y.
8. Una química desea estimar la concentración de partículas que hay en

determinada suspensión. Ella extrae 3 mL de la suspensión y cuenta 48
partículas. Estime la concentración de partículas por mL y determine la
incertidumbre en la estimación.
9. Una microbióloga quiere estimar la concentración de cierto tipo de bacteria en
una muestra de agua tratada. Ella pone una muestra de 0.5 mL de agua tratada en
el vidrio del microscopio y descubre 39 bacterias. Estime la concentración de
92
bacterias por mL, en esta agua tratada y determine la incertidumbre en al
estimación
10. la abuela esta probando una nueva receta de pan de pasas. En cada hornada
de la masa de pan salen tres hojazas, y cada una tiene 20 rebanadas de pan
a) Si ella agrega 100 pasas a cada hornada de masa, ¿Cuál es la
probabilidad de que una rebanada de pan elegida aleatoriamente no tenga
pasas?
b) Si ella agrega 200 pasas a una hornada de masas, ¿cual es la
probabilidad de que una rebanada de pan elegida aleatoriamente tenga
cinco pasas?
c) ¿Cuántas pasas debe agregar para que la probabilidad de que una
rebanada elegida de forma aleatoria no tenga pasas sea 0.01?
11. Mamá y la abuela están horneando, cada una, galletas de chispas de

chocolate. Cada una le da dos galletas. Una de las =atletas de mamá tiene 14
chispas de chocolate y la otra tie ne I I. Las galletas de la abuela tienen seis y
ocho chispas.
a) Estime la media del número de chispas en una de las galletas de mamá.
b) Estime la medía del número de chispas en una de las galletas de la abuela.
c) Determine la incertidumbre en la estimación de las galletas de mamá.
d) Determine la incertidumbre en la estimación de las galletas de la abuela.
e) Estime cuántas chispas más en promedio tiene una galleta de mamá en
comparación con una galleta de la abuela. Determine la incertidumbre en
la estimación.
12. Usted ha recibido una masa radiactiva de la que se afirma tiene una media
de la razón de decaimiento de al menos una partícula por segundo. Si la media
de la razón de decaimiento es menor a una por segundo, usted puede regresar
el producto para un reembolso. Sea X el número de eventos de decaimiento que
se produce en diez segundos.
a) Si la media de la razón de decaimiento es exactamente de una por
segundo (de tal forma que la afirmación es verdad, pero apenas), ¿a qué
es igual P(X 5_ 1)?
93
b) Con base en la respuesta del inciso a), si la razón de decaimiento promedio
es de una partícula por segundo, ¿un evento en diez segundos sería un
número inusualmente pequeño?
c) Si usted encuentra un evento de decaimiento en diez segundos, ¿esto
sería una evidencia de que debe regresarse el producto? Explique.
d) Si la media de la razón de decaimiento es sólo de una por segundo, ¿a
qué es igual P(X 5< 8)?
e)Con base en la respuesta del inciso (d), si la razón de decaimiento promedio

es de una partícula por segundo, ¿ocho eventos en diez segundos sería un
número inusualmente pequeño?
f)Si cuenta ocho eventos de decaimiento en diez segundos, ¿esto sería una
evidencia de que debe regresarse el producto? Explique.
13. Alguien afirma que cierta suspensión contiene al menos siete partículas por
mL. Extrae una muestra de 1 mL de la solución. Sea X el número de
partículas en la muestra.
a) Si el número promedio de partículas es exactamente siete por mL (de
manera que la afirmación es verdad, pero apenas), ¿a qué es igual
P(X 1)?
b) Con base en la respuesta del inciso (a), si la suspensión contiene
siete partículas por mL, ¿una partícula en una muestra de 1 mL sería
un número inusualmente pequeño?
c) Si encuentra una partícula en la muestra, ¿esto sería una evidencia de
que la afirmación es falsa? Explique.
d) Si la media del número de partículas es exactamente 7 por mL, ¿a
qué es igual P(X 6)?
e) Con base en la respuesta del inciso (d), si la suspensión contiene
siete partículas por mL, ¿seis partículas en una muestra de 1 mL sería
un número inusualmente pequeño?
f) Si cuenta seis partículas en la muestra, ¿esto sería una evidencia de
que la afirmación es falsa? Explique.
94
14. Un físico desea estimar la razón de emisiones de partículas alfa
provenientes de cierta fuente. Él hace dos cuentas. Primero mide la razón
fonda contando el número de partículas que hay durante 100 segundos en
ausencia de la fuente. Cuenta 36 emisiones de fondo: Después, con la fuente
presente, cuenta 324 emisiones en 100 segundos. Esto último representa la
suma de las emisiones de la fuente más las emisiones de fondo.
a)Estime la razón de fondo, en emisiones por segundo, y determine la
incertidumbre en la estimación.
b) Estime la suma de la fuente más la razón de fondo, en emisiones por
segundo, y determine la incertidumbre en la estimación.
c) Estime la razón de emisiones provenientes de la fuente en partículas por
segundo, y determine la incertidumbre en la estimación.
d) ¿Qué da como resultado una menor incertidumbre al estimar la razón de
emisiones provenientes de la fuente: (1) contar las partículas de fondo
sólo durante 150 segundos.
3.5 HIPERGEOMÉTRICA
Cuando una población finita contiene dos tipos de unidades, que pueden ser
denominados como éxitos y fracasos, y se extrae una muestra aleatoria simple de
la población, cada unidad representa un ensayo de Bernoulli. A medida que se
selecciona cada unidad, la proporción de éxitos en la población restante disminuye
o aumenta, dependiendo si la unidad extraída es un éxito o fracaso. Por esta
razón, los ensayos no son independientes, de ahí que el número de éxitos en la
muestra no siga una distribución binomial. En su lugar, la distribución que describe
adecuadamente el número de éxitos en esta situación se llama distribución
hipergeométrica.
Como ejemplo, suponga que se tiene un lote de 20 unidades que contiene seis
que están defectuosos, y que se extrae aleatoriamente cinco unidades de este
lote. Sea X el número de unidades defectuosas en la muestra. Se calculará P (X =
2). Con este propósito, primero se cuenta el número total de los grupos diferentes
de cinco unidades que puede extraerse de la población de 20. (Se hará referencia
a cada grupo de cinco unidades como combinación.) El número de combinaciones
de cinco unidades es el número de muestras diferentes que se puede extraer, y
cada una es igualmente probable. Después se determinará cuántas de estas
combinaciones contienen exactamente dos defectuosas. La probabilidad de que
una combinación de cinco unidades contenga solo dos defectuosas es el cociente.
número de combinaciones de cinco unidades que contienen dos defectuosas
P(X=2) =
n ú mero de combinacionesde cincounidades que pueden seleccionarse de 20
95
En general, el número de combinaciones de k unidades que
se puede elegir de un grupo de n unidades se denota
n
por()
k
.
Por tanto, el número de combinaciones de cinco

unidades que se puede elegir entre 20 es:
Para determinar el número de combinaciones de cinco que contienen sólo dos

defectuosas, se describe la construcción de dicha combinación como una
secuencia de dos operaciones. Primero, se seleccionan dos unidades de las seis
defectuosas; segundo, se seleccionan tres unidades de las 14 no defectuosas. El
número de combinaciones de dos unidades seleccionadas entre seis es
y el número de combinaciones de tres unidades elegidas de

14 es:
Por tanto, el número total de combinaciones de cinco unidades que puede

6 14
componerse de dos defectuosas y tres no defectuosas es el producto ( )( )
2 3
=
(15) (364) = 5 460 (ésta es una aplicación del principio fundamental de conteo;
véase la sección 2.2 para un análisis más detallado). Se concluye que:
96
Para calcular P (X = 2) en el ejemplo anterior, fue necesario conocer el número de
unidades en la población (20), el de unidades defectuosas en la población (6) y el
de unidades extraídas (5). La función de masa de probabilidad de la variable
aleatoria X se determina al utilizar estos tres parámetros. Específicamente, X
tiene una distribución hipergeométrica con los parámetros 20, 6 y 5, ello se
denota mediante X — H (20, 6, 5). Ahora se generalizará esta idea.
Suponga una población finita que contiene N unidades, de ellas R son clasificadas
como éxitos y N — R como fracasos. Suponga que se extrae n unidades de esta
población, y sea X el número de éxitos en la muestra. Entonces X sigue la
distribución hipergeomé- trica con los parámetros N,
R y n, que se puede denotar como X — H (N, R,
n). La función de masa de probabilidad de X es:
Ejemplo 4.28
De 50 edificios en un parque industrial, 12 no cumplen el código eléctrico. Si se

seleccionen aleatoriamente diez edificios para inspeccionarlos, ¿cuál es la
probabilidad de que exactamente tres de los diez no cumplan el código?
Solución
Sea X el número de edificios seleccionados que violan el código. Entonces, X
-H (50,12,10). Se debe determinar P (X = 3). Utilizando la ecuación (4.15),
97
3.6 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR
En el recuadro siguiente se presenta la media y varianza de la distribución
hipergeométrica. Se omiten sus deducciones.
Ejemplo 4.29
Con referencia al ejemplo 4.28 encuentre la media y la varianza de X:
Solución
X — H (50, 12, 10), por lo que
Comparación De La Distribución Binomial

Una población de tamaño N contiene R éxitos y N — R fracasos. Imagine que se
toma una muestra de n unidades de esta población con reemplazo; es decir, cada
unidad de la muestra se regresará a la población después de ser extraída.
Entonces, las unidades de la muestra son resultado de una secuencia de ensayos
de Bernoulli independientes, y el
número de los éxitos X en la
muestra tiene una distribución
binomial con n ensayos y
probabilidad de éxito:
P=R/N
98
En la práctica, rara vez se extraen muestras con reemplazo, debido a que no es
necesario extraer la misma unidad dos veces. En su lugar, el muestreo se realiza
sin reemplazo, en el cual cada unidad es eliminada de la población después de
que es extraída. Entonces, las unidades de la muestra son resultado de ensayos
de Bernoulli dependientes, ya que la población cambia conforme se extrae cada
unidad. Por esta razón, la distribución del número de éxitos, X, es H (N, R, n) en
vez de Bin (n, R / N).
Cuando el tamaño muestra n es pequeño en comparación con el tamaño de
la población N (es decir, no mayor a 5%), la diferencia entre el muestreo con o sin
reemplazo es poca, y la distribución binomial Bin (n, R / N) es una buena
aproximación de la distribución hipergeométrica H (N, R, n). Observe que la media
de H (N, R, n) es n R / N, la misma que la de Bin (n, RIN). Esto último indica que
sea que realice la muestra con o sin reemplazo, la proporción de éxitos de la
muestra en promedio es la misma que la de éxitos de la población. La varianza de
Bin (n, R / N) es n (R / N) (1 — R / N) y la varianza de H (N, R, n) se obtiene al
multiplicar esto por el factor (N — n) / (N — 1). Observe que cuando n es pequeña
en relación con N, este factor se aproxima a 1.
3.7 GRÁFICA
Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las
que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli)
de manera que en cada experiencia la probabilidad de obtener cada uno de los
dos posibles resultados se mantenía constante. Si el proceso consistía en una
serie de extracciones o selecciones ello implicaba la reposición de cada extracción
o selección, o bien la consideración de una población muy grande. Sin embargo, si
la población es pequeña y las extracciones no se remplazan las probabilidades no
se mantendrán constantes. En ese caso las distribuciones anteriores no nos
servirán para la modelizar la situación. La distribución hipergeométrica viene a
cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no
constantes (sin reemplazamiento).
La distribución hipergeométrica es especialmente útil en todos aquellos casos en
los que se extraigan muestras o se realizan experiencias repetidas sin devolución
del elemento extraído o sin retornar a la situación experimental inicial.
Modeliza, de hecho, situaciones en las que se repite un número determinado de
veces una prueba dicotómica de manera que con cada sucesivo resultado se ve
alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es
una distribución. fundamental en el estudio de muestras pequeñas de poblaciones
pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los que
no es posible retornar a la situación de partida.
La distribución hipergeométrica puede derivarse de un proceso experimental puro
o de Bernouilli con las siguientes características:
99
El proceso consta de n pruebas, separadas o separables de entre un conjunto de
N pruebas posibles.
Cada una de las pruebas puede dar únicamente dos resultados mutuamente
excluyentes: A y no A.
En la primera prueba las probabilidades son: P(A)= p y P(A)= q; con p + q =l.
Las probabilidades de obtener un resultado A y de obtener un resultado no A
varían en las sucesivas pruebas, dependiendo de los resultados anteriores.
(Derivación de la distribución). Si estas circunstancias a aleatorizamos de forma
que la variable aleatoria X sea el número de resultados A obtenidos en n pruebas
la distribución de X será una Hipergeométrica de parámetros N, np así
Un típico caso de aplicación de este modelo es el siguiente:
Supongamos la extracción aleatoria de n elementos de un conjunto formado por N
elementos totales, de los cuales Np son del tipo A y Nq son del tipo (p+q=l). Si
realizamos las extracciones sin devolver los elementos extraídos, y llamamos X. al
número de elementos del tipo A que extraemos en n extracciones X seguirá una
distribución hipergeométrica de parámetros N, n, p
Función de cuantía.
La función de cuantía de una distribución Hipergeométrica hará corresponder a
cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x
resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas
de entre las N posibles.
Veamos:
Hay un total de formas distintas de obtener x resultados del tipo A y n
x del tipo , si partimos de una población formada por Np elementos del tipo A y
Nq elementos del tipo o lado si realizamos n pruebas o extracciones hay un
total de posibles muestras (grupos de n elementos)
aplicando la regla de Laplace tendríamos
100

que para valores de X comprendidos entre el conjunto de enteros 0, 1,…. . n será

la expresión de la función de cuantía de una distribución hipergeométrica de
parámetros N, n, p.
Media y varianza.
Considerando que una variable hipergeométrica de parámetros N, n, p puede
considerarse generada por la reiteración de un proceso dicotómico n veces en el
que las n dicotomías NO son independientes; podemos considerar que una
variable hipergeométrica es la suma de n variables dicotómicas NO
independientes.
Es bien sabido que la media de la suma de variables aleatorias (sean éstas
independientes o no) es la suma de las medias y por tanto la media de una
distribución hipergeométrica será, como en el caso de la binomial :
En cambio si las variables sumando no son independientes la varianza de la
variable suma no será la suma de las varianzas.
Si se evalúa el valor de la varianza para nuestro caso se obtiene que la varianza
de una distribución hipergeométrica de parámetros N,n,p es : si

Esta forma resulta ser la expresión de la varianza de una binomial (n, p) afectada
por un coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o
Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que
produce la no reposición de los elementos extraídos en el muestreo.
Este coeficiente es tanto más pequeño cuanto mayor es el tamaño muestral
(número de pruebas de n) y puede comprobarse como tiende a aproximarse a 1
cuando el tamaño de la población N es muy grande . Este último hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposición o no cuando se
realizan extracciones sucesivas sobre una población muy grande. Con una
población muy grande se cual fuere el tamaño de n, el factor corrector sería uno lo
que convertiría, en cierto modo a la hipergeométrica en una binomial (ver D.
Binomial). Así
101
Límite de la distribución hipergeométrica cuando N tiende a infinito.
Hemos visto como la media de la distribución hipergeométrica [H{N,n,p)], tomaba
siempre el mismo valor que la media de una distribución binomial [B{n,p)] también
hemos comentado que si el valor del parámetro N crecía hasta aproximarse a
infinito el coeficiente de exhaustividad tendía a ser 1, y, por lo tanto, la varianza de
la hipergeométrica se aproximaba a la de la binomial : puede probarse asimismo ,
cómo la función de cuantía de una distribución hipergeométrica tiende a
aproximarse a la función de cuantía de una distribución binomial cuando
Puede comprobarse en la
representación gráfica de una
hipergeométrica con N =100000
como ésta ,es idéntica a la de
una binomial con los mismos
parámetros restantes n y p , que
utilizamos al hablar de la
binomial.
De manera análoga a como se
obtenía la moda en la distribución
binomial es fácil obtener la
expresión de ésta para la
distribución hipergeométrica. De
manera que su expresión X0
sería la del valor o valores
enteros que verificasen.

3.8 NORMAL Y LOGARÍTMICO-NORMAL

La distribución normal (también conocida como distribución de Gauss) la
distribución más utilizada en la estadística. Constituye un buen modelo para
muchas. aunque no para todas las poblaciones continuas. Parte de esto último se
debe al teorema del límite central, que se analizará en la sección 4.10.
La distribución normal es continua en vez de discreta. La media de una variable
aleatoria normal puede tener cualquier valor y la varianza cualquier valor positivo.
La función de densidad de probabilidad de una variable aleatoria normal con
media u, y varianza o2 está dada por:
102
Al final de esta sección se comprueba el hecho de que, u y o 2 son la media y
varianza, respectivamente. Si X es una variable aleatoria cuya función de
densidad de probabilidad es normal con media u, y varianza o 2, se expresa como
x – (u,o2)
La figura 4.4 presenta una gráfica de la función de densidad de probabilidad

normal con media u y desviación estándar. Algunas veces a la función de
densidad de probabilidad normal se le llama curva normal. Observe que ésta es
simétrica alrededor de u, de tal forma que u, representa la mediana, así como la
media, también, toda población normal se caracteriza por:
La proporción de una población normal que se encuentra a cierto número de

desviaciones estándar de la media es la misma en cualquier población normal.
Por esta razón, cuando se trabaja con poblaciones normales, se convierte las
unidades en las cuales se midió originalmente las unidades de la población a
unidades estándar. Estas últimas indican a cuántas desviaciones estándar se
encuentra un dato en la media poblacional.
103
En general se convierte a unidades estándar al restar la media y dividir entre la
desviación estándar. Por consiguiente, si x es una unidad seleccionada de una
población normal con media u y varianza o2, la unidad estándar equivale a x es
el número z, donde:
Algunas veces al número z se le denomina “puntaje z” de x, que representa un

elemento extraído de una población normal con media 0 y desviación estándar
1. A aquella sele lama oblación normal estándar.
La proporción de una población normal que se encuentra dentro de un intervalo

especifico es igual a al área que se encuentra debajo de la densidad de
probabilidad normal en dicho intervalo. Esto último sugiere que dichas
proporciones se calculan al integrar la densidad de probabilidad normal dada en
la ecuación (4.23). Lo que es muy interesante es que las áreas debajo de esta
curva no pueden determinarse mediante el método, enseñado en cálculo ele-
mental, de encontrar la integral de la función y colocar los límites de integración.
Lo anterior. se debe a que la integral de esta función es una serie infinita y no
puede escribirse con exactitud. En su lugar, las áreas debajo de esta curva
deben aproximarse numéricamente.
Las áreas debajo de la curva normal estándar (media 0, varianza 1) se han
tabulado extensivamente. Para determinar las áreas debajo de una curva normal
con diferentes media y varianza, se convierte a unidades estándares y se utiliza
la tabla z. La tabla A.2 proporciona las áreas en la cola izquierda de la curva
para valores de z. Es posible calcular otras áreas al sustraer o usando el hecho
de que el área total debajo de la curva es igual a 1.
Ejemplo 4.44
¿A qué puntaje z corresponde el 75o. percentil de una cuna normal? ¿El 25o.
percentil? ¿La mediana?
Solución
Para responder esta pregunta se utiliza al revés la tabla z. Se necesita encontrar

el puntaje para el que 75% del área de la curva está a la izquierda. A partir del
contenido de la tabla, el área más cercana a 75% es 0.7486, correspondiente al
puntaje a de 0.67. Por tanto, el 75o. percentil es aproximadamente de 0.67. Por
simetría de la curva, el 25o. percentil es z = —0.67 (esto también puede verse
directamente en la tabla), Véase la figura 4.8. La mediana es z = 0.
104
Ejemplo 4.45
Los tiempos de vida de las baterías en cierta aplicación se distribuyen
normalmente con media de 50 horas y desviación estándar de cinco horas.
Determine la probabilidad de que se elija aleatoriamente una batería que dure
entre 42 y 52 horas.
Solución
Sea X el tiempo de vida de una batería elegida aleatoriamente. Entonces X —
N(50, 52). La figura 4.49 muestra la función de densidad de probabilidad de la
población N(50, 52). El área sombreada representa P(42 < X < 52), la probabilidad
de que una batería seleccionada de forma aleatoria tenga una duración entre 42 y
52 horas. Para calcular esta área, se hará uso de la tabla z. Primero se necesita
convertir las cantidades 42 y 52 a unidades estándar. Se tiene
De la
tabla z, el área a la izquierda de z = —1.60 es 0.0548, y el área a la izquierda de z
= 0.40 es 0.6554. La probabilidad de que una batería tenga tiempo de vida entre
42 y 52 horas es 0.6554 — 0.0548 = 0.6006.
Ejemplo 4.46
Con referencia al ejemplo 4.45, determine el 40o. percentil de los tiempos de vida
de las baterías.
Solución
De la tabla z, el área más cercana a 0.4000 es 0.4013, correspondiente al puntaje
z de —0.25. La población de los tiempos de vida tiene una media de 50 y una
desviación estándar de 5. El 40o. percentil es el punto 0.25 desviaciones estándar
menor a la media. Este valor se determina al convertir el puntaje z en uno nuevo,
utilizando la ecuación (4.24):
105
Al despejar x se tiene que x = 48.75. El 40o. percentil de los tiempos de vida de
las baterías es de 48.75 horas Véase la figura 4.10.
Ejemplo 4.47
Un proceso fabrica cojinetes de bolas cuyos diámetros se distribuye normalmente
con media de 2.505 cm y desviación estándar de 0.008 cm. Las especificaciones
requieren que el diámetro esté dentro del intervalo 2.5 ± 0.01 cm. ¿Qué proporción
de cojinetes de bolas cumple con la especificación?
Solución
Sea X el diámetro de un cojinete de bolas
seleccionado aleatoriamente. Entonces
X — N(2.505, 0.0082). La figura 4.11
presenta la función de densidad de
probabilidad de la población N(2.505,
0.0082). El área
sombreada
representa P(2.49 < X < 2.51), que es la proporción de
cojinetes de bolas que cumplen con la especificación. Se calcula los puntajes z
de 2.49 y 2.51:
106
El área a la izquierda de z = —1.88 es 0.0301. El área a la izquierda de z = 0.63
es 0.7357. El área entre z = 0.63 y z = —1.88 es 0.7357 — 0.0301 = 0.7056.
Aproximadamente 70.56% de los diámetros satisface la especificación.
Ejemplo 4.48
Con referencia al ejemplo 4.47, el proceso puede recalibrarse para que la media
sea igual a 2.5 cm, el centro del intervalo de la especificación. La desviación
estándar del proceso sigue siendo de 0.008 cm. ¿Qué proporción de los
diámetros satisface la especificación?
Solución
El método de solución es el mismo que en el ejemplo 4.47. La media es de 2.500
en vez de 2.505. Los cálculos se realizan de la siguiente manera:
El área a la izquierda
de z = - 1.25 es 0.1056. El área a la izquierda de z = 1.25 es 0.8944. El área entre
z = 1.25 y z = - 1.25 es 0.8944 - 0.1056 = 0.7888. Véase la figura 4.12. El
recalibrado aumenta a 78.88% la proporción de diámetros que satisface la
especificación.
107
Ejemplo 4.49
Con referencia a los ejemplos 4.47 y 4.48, suponga que se ha recalibrado el
proceso de tal forma que la media del diámetro mide ahora 2.5 cm. ¿A qué valor
debe reducirse la desviación estándar para que 95% de los diámetros satisfaga la
especificación?
Solución
El intervalo de especificación es 2.49 - 2.51 cm. Se debe encontrar un valor de u
para que este intervalo abarque 95% de la población de diámetros de cojinetes de
bolas. Véase la figura 4.13. El puntaje z que tiene 2.5% del área a la izquierda es
z= - 1.96. El pontaje z que tiene 2.5% del área a su derecha es z = 1.96 (esto
último se obtiene de la simetría de la curva). De ahí que el límite menor de la
especificación, 2.49, tenga un puntaje z de -1.96, mientras que el límite superior
de 2.51 tiene un puntaje z de 1.96. Cualesquiera de estos hechos se pueden
utilizar para encontrar a u. De la ecuación (4.24),
Al despejar u se tiene que u = 0.0051 cm.
Estimación De Los Parámetro De Una Distribución Normal
Los parámetros u y o de una distribución normal representan su media y su

varianza, respectivamente. Por tanto X 1…..Xn son una muestra aleatoria de una
distribución N(u,o2), u se estima con Ia media muestral X o 2 se estima con la
varianza muestral S2.Al igual que con cualquier otra media, la incertidumbre en X
es u / √ n que será reemplazada con S / √ n si no se conoce a σ . Además μx = μ,
por lo que X es un estimador no sesgado de μ.
108
Combinaciones Lineales De Variables Aleatorios Independientes Normales
Una de las características más notables de la distribución normal consiste en que
las combinaciones lineales de variables aleatorias independientes normales son
en sí mismas variables aleatorias. Para ser más específico, suponga que X1 – N( μ
1, σ 1) - X2 – N(μ2, σ 2) son variables aleatorias independientes normales. Observe
que las medias y varianzas de estas variables aleatorias pueden diferir entre sí.
Sean c1, c2 constantes. Entonces, la combinación lineal c1x1 + c2x2 es una
variable aleatoria distribuida normalmente. La media y la varianza de la
combinación lineal son c1μ1 + c2μ2 respectivamente.
Ejemplo 4.50
En el artículo "Advances in Oxygen Equivalent Equations for Predicting the

Properties of Titanium Welds" (D. Harwig, W. Ittiwattana y H. Castner, en The
Welding Journal, 2001: 126s-136s), los autores proponen una ecuación de
equivalencia al oxígeno para predecir la resistencia ductilidad y dureza de
soldaduras hechas casi de titanio puro.
La ecuación es E=2C + 3.5N + O, donde E es la equivalencia del oxígeno, y C, N y
O las proporciones de peso, en partes por millón, de carbono, nitrógeno y oxígeno,
respectivamente (se omitió un término constante que consiste en el contenido de
hierro). Suponga que para un nivel particular de
titanio puro comercial, las cantidades C, N y O son aproximadamente
independientes y se distribuyen normalmente con medias uc = 150, u N = 200, uo
=1 500 y desviaciones estándar oc=30, o N = 60, o = 100. Determine la distribución
de E. Determine P (E > 3 000).
Solución
Puesto que E es una combinación lineal de variables aleatorias normales
independientes, su distribución es normal. Ahora se debe determinar la media y la
varianza de E. Utilizando la ecuación (4.25) se calcula:
109
Se concluye que E — N(2 500, 57 700).
Para calcular P(E > 3 000), se calcula el puntaje z: z = (3 000 — 2 500)/ √ 57 700 =
2.08. El área a la derecha de z = 2.08 debajo de la curva normal es 0.0188. Por
tanto, P(E > 3 000) = 0.0188.
Otras combinaciones lineales importantes son la suma y resta de dos variables

aleatorias. Si X y Y son variables aleatorias independientes, la suma X -I- Y y la
resta X — Y son combinaciones lineales. Las distribuciones X + Y y X — Y se
puede determinar utilizando la ecuación (4.25) con ci = 1, c2 = 1 para X + Y y ci =
1, c2 = — 1 para X — Y.
¿Cómo Puede Saberse Si Los Datos Que Se Tiene Proviene De Una

Población Normal?
110
En la práctica, a menudo se tiene una muestra de alguna población y se le debe
utilizar para decidir si la distribución de la población se aproxima a la normal. Si la
muestra es razonablemente grande, su histograma es buena indicación. Las
muestras grandes de poblaciones normales tienen histogramas que se parecen a
la función de densidad normal: con un pico en el centro, y decrecientes más o
menos simétricamente en cada lado. Las gráficas de probabilidad son otra buena
forma de determinar si una muestra grande proviene de una población que es
aproximadamente normal. Para muestras pequeñas, es difícil determinar si la
distribución normal es apropiada.
Un hecho importante es éste: las muestras de poblaciones normales raramente
tienen datos atípicos. Por tanto, no se utiliza la distribución normal en conjuntos de
datos que tengan valore atípicos. Esto es cierto cuando el tamaño muestral es
pequeño. Infortunadamente, par conjuntos pequeños de datos que no tienen datos
atípicos, es difícil determinar si la población es aproximadamente normal. En
general, se requiere de cierto conocimiento de proceso que generó los datos.

Sea X – (u,o2). Se demuestra que ux = y, y ox. = o 2. Empleando la definición de la
media poblacional de una variable aleatoria continua
111
Ejercicios para la sección 4.5
1. Determine el área bajo la curva normal
a) A la derecha de z = - 0.85.
b) Entre z= 0.40 y z = 1.30.
c) Entre z - 0.30 y z = 0.90.
d) Desde z = - 1.50 hasta z = - 0.45.
2. Determine el área bajo la curva normal

a) A la izquierda de z = 0.56.
b) Entre z = - 2.93 y z = - 2.06.
c) Entre z= - 1.08 y z = 0.70.
d) Desde z = 0.96 hasta z = 1.62.
3. Las puntuaciones de una prueba estandarizada se distribuyen normalmente con

media de 480 y desviación estándar de 90.
a) ¿Cuál es la proporción de puntuaciones mayores a 700?
b) ¿Cuál es el 25o. percentil de las puntuaciones?
c) Si la puntuación de alguien es de 600, ¿en qué percentil se encuentra?
d) ¿Qué proporción de las puntuaciones se encuentra entre 420 y 520?
4. Suponga que la estatura de mujeres en una población sigue la curva normal con
media de 64.3 pulgadas y desviación estándar de 2.6 pulgadas.
a) ¿Qué proporción de mujeres tiene estatura entre 60 y 66 pulgadas?
b) La estatura de una mujer es 0.5 de desviación estándar mayor a la media.
¿Qué proporción de mujeres mide más que ella?
c) ¿Cuánto mide una mujer cuya estatura se encuentra en el 90o. percentil?
d) Se elige aleatoriamente una mujer de esta población. ¿Cuál es la probabilidad
de que ella mida más de 67 pulgadas?
e) Se elige aleatoriamente a cinco mujeres de esta población. ¿Cuál es la
probabilidad de que sólo una de ellas mida más de 67 pulgadas?
5. La resistencia de una aleación de aluminio se distribuye normalmente con

media de 10 giga páscales (GPa) y desviación estándar de 1.4 GPa.
a) ¿Cuál es la probabilidad de que una muestra de esta aleación tenga resistencia
mayor a 12 GPa?
b) Determine el primer cuartil de la resistencia de esta aleación.
c)Determine el 95o. percentil de la resistencia de esta aleación.
6. En una universidad, las puntuaciones del SAT en matemáticas de una clase de

primer año fue de, en promedio, 650 y tuvo desviación estándar de 100. El
máximo puntaje posible es de 800. ¿Es posible que el histograma de las puntua-
ciones de estos alumnos siga una curva normal? Explique.
7. La penicilina es producida por el hongo Penicillium, que crece en un caldo, cuyo

contenido de azúcar debe controlarse con cuidado. La concentración óptima de
112
azúcar es de 4.9 mg/ml. Si la concentración excede los 6 mg/ml, el hongo muere y
el proceso debe suspenderse todo el día.
a) Si la concentración de azúcar en tandas de caldo se distribuye normalmente
con media 4.9 mg/ml y desviación estándar 0.6 mg/ml, ¿en qué proporción de días
se suspenderá el proceso?
b) El distribuidor ofrece vender caldo con una concentración de azúcar que se
distribuye normalmente con media de 5.2 mg/ml y desviación estándar de 0.4
mg/ml. ¿Este caldo surtirá efectos con menos días de producción perdida?
Explique.
8. Un método de cromatografía utilizado para purificar a una proteína también

destruye parte de ésta, en un proceso denominado desnaturación. Un método
particular recupera una media de 55% (0.55) de la proteína y tiene desviación
estándar de 0.15. La cantidad recuperada se distribuye normalmente.
a) En cierto proceso industrial, no es posible obtener una recuperación menor a
0.30 más de 5% de las veces. ¿Este proceso cumple con este requisito? Explique.
b) En otro proceso, la recuperación debe ser mayor a 0.50 al menos 95% de las
veces. Si la media de la recuperación se distribuye normalmente con una media
de 0.60 ¿cuál es el valor más grande que puede tener la desviación estándar para
cumplir con este requisito?
9. Se hace una perforación cilíndrica en un molde y se coloca un pistón cilíndrico

en la perforación. La holgura es igual a la mitad de la diferencia entre los
diámetros de la perforación y el pistón. El diámetro de la perforación se distribuye
normalmente con media de 15 cm y desviación estándar de 0.025 cm, y el
diámetro del pistón se distribuye con media de 14.88cm y desviación estándar
0.015cm
a) Determine la media de la holgura.
b) Determine la desviación estándar de la holgura.
c) ¿Cuál es la probabilidad de que la holgura mida menos de 0?05 cm?
d) Determine el 25o. percentil de la holgura.
e) Las especificaciones requieren que la holgura mida entre 0.05 y 0.09 cm. ¿Cuál
es la probabilidad de que 1, holgura satisfaga la especificación?
f) Se puede ajustar la media del diámetro de la perforación. ¿A qué valor debe
ajustarse para maximizar la probabilidad de que la holgura esté entre 0?05 y 0.09
cm?
10. Los ejes fabricados para el uso de dispositivos de almacenamiento óptico

tienen diámetros que se distribuyen normalmente con media u = 0.652 y
desviación estándar o- = 0.003 cm. La especificación para el diámetro del eje mide
entre 0.650 ± 0.005 cm.
a) ¿Qué proporción de los ejes fabricados por este procese cumple con la
especificación?
b) La media del proceso puede ajustarse utilizando calibración. Si se establece
que la media mide 0.650 cm, ¿qué proporción de los ejes cumplirá con la
especificación?
113
c) Si se establece que la media mide 0.650 cm, ¿cuál debe ser la desviación
estándar para que 99% de los ejes cumpla con la especificación?
11. El volumen de latas llenadas por cierta máquina se distribuye con media de
12.05 onzas y desviación estándar de 0.03 onzas.
a) ¿Qué proporción de latas contiene menos de 12 onzas?
b) La media del proceso se puede ajustar utilizando calibración. ¿En qué valor
debe fijarse la media para que 99% de las latas contenga 12 onzas o más?
c) Si la media del proceso sigue siendo de 12.05 onzas, ¿en qué valor debe
fijarse la media para que 99% de las latas contenga 12 onzas o más?
12. Un proceso de recubrimiento de películas genera filmes cuyo espesor se

distribuye con media de 110 micrones y desviación estándar de 10 micrones. En
cierta aplicación, el espesor mínimo aceptable es de 90 micrones.
a) ¿Qué proporción de películas estarán demasiado delgadas?
b) ¿a qué valor debe establecerse la media para que sólo 1% de las películas esté
muy delgadas?
c) Si la media sigue siendo 110, ¿Cuál debe ser la desviación estándar para que
sólo 1% de las películas sea muy delgada?
13. Un proceso hilador de fibras produce una fibra cuya resistencia se distribuye
con media de 75 N/m2. La resistencia mínima aceptable es de 65 N/m2.
a) 10% de las fibras producidas mediante el método actual no cumple con la
especificación mínima. ¿Cuál es la desviación estándar de la resistencia de las
fibras en el proceso actual?
b) Si la media sigue siendo de 75 N/m2, ¿cuál debe ser la desviación estándar
para que sólo 1% de las fibras no satisfaga la especificación?
c) Si la desviación estándar es de 5 N/m2, ¿en qué valor debe fijarse la media
para que sólo 1% de las fibras no satisfaga la especificación?
14. El programa de garantía de calidad de cierto proceso de formulación de un

adhesivo consiste en medir qué tanto el adhesivo pega un pedazo de plástico a
una superficie de vidrio. Cuando el proceso funciona correctamente, la fuerza del
adhesivo X se distribuye con media de 200 N y desviación estándar de 10 N. Cada
hora, usted hace una medición de la fuerza del adhesivo. Usted debe informar a
su supervisor si su medición indica que el proceso se ha desviado de su
distribución objetivo.
a) Calcule P (X s 160) bajo el supuesto de que el proceso está funcionando
correctamente.
114
b) Con base en su respuesta al inciso a), si el proceso funciona bien, ¿una fuerza
de 160 N sería inusualmente pequeña? Explique.
c) Si usted observa una fuerza adhesiva de 160 N, ¿esto último sería una
evidencia de que el proceso ya no funciona correctamente? Explique.
d) Encuentre P (X 203), bajo la suposición de que el proceso está funcionando
bien.
e) Con base en su respuesta del inciso d), si el proceso funciona correctamente,
¿sería una fuerza de 203 N inusualmente grande? Explique.
f) Si usted observa una fuerza adhesiva de 203 N, ¿lo anterior sería una evidencia
de que el proceso ya no funciona correctamente? Explique.
g) Encuentre P (X -5- 195), bajo la suposición de que el proceso está funcionado
bien.
h) Con base en su respuesta del inciso g), si el proceso está funcionando
correctamente, ¿sería una fuerza de 195 N inusualmente pequeña? Explique.
i) Si usted observa una fuerza adhesiva de 195 N, ¿esto sería una evidencia de
que el proceso ya no funciona correctamente? Explique.
15. Una instalación de luz tiene dos focos. El A es de un tipo cuya duración se
distribuye con media de 800 horas y desviación estándar de 100 horas. El B tiene
una duración que se distribuye con media de 900 horas y desviación estándar de
150 horas. Suponga que las duraciones de los focos son independientes.
a) ¿Cuál es la probabilidad de que el foco B dure más que el A?
b) ¿Cuál es la probabilidad de que el foco B dure 200 horas más que el A?
c) Otra instalación de luz tiene sólo un foco. Se pone uno del tipo A y cuando se
funde se instala otro de tipo B. ¿Cuál es la probabilidad de que la duración total de
ambos sea mayor a 2 000 horas?
16. La molaridad de un soluto en solución se define como el número de moles del
soluto por litro de solución (1 mol = 6.02 x 1023 moléculas). Si X es la molaridad
de una solución de cloruro de sodio (NaC1) y Y es la molaridad de una solución de
carbonato de sodio (Na2CO3), la molaridad del ion de sodio (Na+) en una solución
hecha de partes iguales NaC1 y Na2CO3 está dada por M = 0.5X + Y. Suponga
que X y Y son independientes y se distribuyen normalmente y que X tiene media
de 0.450 y desviación estándar de 0.050, y Y tiene media de 0.250 y desviación
estándar de 0.025.
a) ¿Cuál es la distribución de M?
b) Determine P (M > 0.5).
115
17. Una compañía recibe importante cargamento de pernos. Éstos se utilizarán en
una aplicación que necesita de una torsión de 100 J. Antes de que se acepte el
cargamento, un ingeniero especialista en control de calidad sacará una muestra
de 12 pernos y medirá la torsión necesaria para romper a cada uno de ellos. El
cargamento será aceptado si el ingeniero concluye que menos de 1% de los
pernos tiene torsión de ruptura menor a 100 J.
a) Si los 12 valores son 107, 109, 111, 113, 113, 114, 114, 115, 117, 119, 122,
124, calcule la media y la desviación estándar muestral.
b) Suponga que se saca una muestra de 12 valores de una población normal, y
suponga que la media y la desviación estándar muestrales calculadas en el inciso
a) son realmente la media y la desviación estándar de la población. Calcule la
proporción de pernos cuya torsión de ruptura es menor a 100 J. ¿Será aceptado el
cargamento?
c) ¿Qué pasará si los 12 valores hubieran sido 108, 112, 114, 114, 115, 115, 116,
118, 120, 123, 140? ce el método descrito en los incisos a) y b) para? minar si el
cargamento hubiera sido aceptado.
d) Compare los conjuntos de 12 valores en los inciso c). ¿En qué muestra los
pernos son más resistente:
e) ¿El método es válido para ambas muestras? ¿por o por qué no?
Distribución Logarítmico-normal
Para datos que tienen valores atípicos, la distribución normal no es apropiada. La
distribución lognormal que tiene relación con la distribución normal, es, a menudo,
buena opción para estos conjuntos de datos. La distribución lognormal se deriva
de la distribución normal de siguiente manera: Si X es una variable aleatoria
normal con media u y varianza o2, entonces la variable aleatoria Y = e x tiene
distribución lognormal con parámetros u y o 2, entonces X = ln y tiene una
distribución normal con media u y varianza o 2.
La
función de densidad de probabilidad de una variable aleatoria lognormal con
parámetros u y o2 es:
116
La figura 4.14 presenta una gráfica de la función de densidad lognormal con
parámetros u = 0 y o = 1. Observe que la función de densidad está sesgada. Ésta
es la razón por la que se utiliza la distribución lognormal para modelar procesos
que tienden a producir ocasionalmente valores grandes o atípicos.
Puede demostrarse mediante métodos avanzados que, si Y es una variable

aleatoria lognormal con parámetros u y o 2, entonces la media E(Y) y la varianza
V(Y) están dadas por
Observe que, si Y
tiene una distribución normal, los parámetros u y o 2 no se refieren a la media y
varianza de Y, sino que lo hacen a la media y varianza de la variable aleatoria
normal ln Y, se utiliza la notación E(Y) en vez de que u y y V(Y) lugar de oy, para
evitar confusiones entre u y o.
Ejemplo 4.51
El tiempo de vida de cierto componente sigue una distribución lognormal con
parámetros u = 1 día
El tiempo de vida de cierto componente sigue una distribución lognormal con
parámetros p, = 1 día y o- = 0.5 días. Determine la media del tiempo de vida de
estos componentes. Encuentre la desviación estándar de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente escogido aleatoriamente. La media de
Y determinada mediante la ecuación (4.30) es e' + 0.52/2 = 3.08 días. La varianza
117
es e2(1) + 2(0.5)2 e2(1) + (0.5)2 = 2.6948. Por tanto, la desviación estándar es
12.6948 = 1.64 días.
Para calcular las probabilidades de variables aleatorias lognormales, se saca el
logaritmo y se utiliza la tabla z (tabla A.2). Los ejemplos 4.52 y 4.53 ilustran el
método.
Ejemplo 4.52
Con referencia al ejemplo 4.51, encuentre la probabilidad de que un componente
dure cuatro días.
Solución
Sea Y el tiempo de vida de un componente seleccionado de forma aleatoria. se
necesita calcular P (Y > 4). No se puede utilizar la tabla z para Y, debido a que Y
no proviene de una población norma. Sin embargo, In Y proviene de una población
normal; específicamente N (1, 0.52). Se expresa P (Y > 4) como una probabilidad
que implica a In Y:
El puntaje z de 1.386 es:
De la tabla z se tiene que P (ln Y > 1.386) = 0.2206. Se concluye que

aproximadamente 22% de los componentes durará más de 4 días.
118
Ejemplo 4.53
Con referencia al ejemplo 4.51 determine la mediana de los tiempos de vida.
Encuentre 80º percentil de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente escogido aleatoriamente. Sea m la
mediana de los tiempos de vida. Entonces P (Y<m) = 0.5. en los logaritmos se
tiene que P (Y ln <ln m) = 0.5.
Esto significa que ln m es la mediana de ln y. ahora, ln Y – (1.05) Por
consecuencia ln m = 1, por lo que m = e = 2.718.
Para encontrar al 80º percentil se hace P (Y < P 80) = .80.
Por lo que P (ln Y < ln p80) = 0.80
P80) 0.80. Esto significa que In p80 es el 80o. percentil de In Y. Ahora In Y —
0.52).
Estimación De Los Parámetros De Una Distribución Lognormal
Ejemplo 4.53
Los diámetros (en mm) de las semillas de cierta planta siguen una distribución
normal. Una muestra aleatoria de cinco semillas tiene los diámetros 1.52, 2.22,
2.64, 2.00 y 1.69. Estime los parámetros u y o.
Solución
Para estimar p. y u, se sacan los logaritmos de los cinco valores de la muestra,
para obtener 0.419, 0.798, 0.971, 0.693 y 0.525. La media muestral es 0.681 y la
desviación estándar muestral es 0.218. Por consecuencia, se estima que µ =
0.681, é; = 0.218.
3.10 GRÁFICA
Como se afirmó anteriormente, es muy raro que las muestras provenientes de

poblaciones normales contengan datos atípicos. En contraste, las muestras
provenientes de poblaciones lognormales a menudo tienen datos atípicos en la
cola derecha. Es decir, las muestras contienen pocos valores que son más
grandes que el resto de los datos. Obviamente, esto último se refleja en la larga
cola derecha de la función de densidad lognormal (figura 4.14). Para las muestras
con datos atípicos a la derecha, se transforman los datos, sacando el logaritmo
natural (o cualquier logaritmo) de cada valor. Luego se intenta determinar si estos
logaritmos vienen de una población normal, graficándolos en un histograma o en
una gráfica de probabilidad. En la sección 4.9 se analizarán las gráficas de
probabilidad.
119
Observe que la densidad lognormal tiene sólo una cola larga, a la derecha. Por
esta razón, las muestras de poblaciones lognominoales tienen datos atípicos a la
derecha, pero no a la izquierda. Por consiguiente, no debe utilizarse la distribución
lognormal en muestras con inusualmente muy pocos datos. Además, las
poblaciones lognormales sólo tienen valores positivos, por lo que no puede
emplearse la distribución lognormal en muestras que contengan ceros o valores
negativos. Por último, es importante observar que la transformación log no
siempre genera una muestra que se aproxima a la normal. Para verificar lo
anterior, se tiene que graficar un histograma o un gráfico de probabilidad (véase la
sección 4.9).
La figura 4.16 presenta dos histogramas. El primero muestra la producción
mensual de 255 pozos de gas, en unidades de miles de pies cúbicos. El
histograma claramente tiene una larga cola derecha, por lo que se concluye que
los datos no provienen de una población normal. La segunda muestra los
logaritmos naturales de las producciones mensuales. Este histograma se aproxima
más a la curva normal, aunque se percibe cierta diferencia con la normalidad.
Histograma que muestra la producción mensual de 225 pozos de gas. Tiene una
larga cola derecha. Histograma que muestra los logaritmos naturales de as
producciones mensuales. Las distribuciones de los datos logarítmicos se
aproximan mucho más a la normal.
Ejercicios para la sección 4.6
1. El tiempo de vida (en días) de cierto componente electrónico que opera en un
ambiente a alta temperatura sigue una distribución lognormal con p, = 1.2 y o =
0.4.
a) Determine la media del tiempo de vida.
120
b) Determine la probabilidad de que un componente dure entre tres y seis días.
c) Determine la mediana del tiempo de vida.
d) Determine al 90o. percentil de los tiempos de vida.
2. Cuando un pesticida entra en contacto con la piel, se absorbe cierto porcentaje

de éste. El porcentaje del pesticida que será absorbido durante cierto espacio de
tiempo puede modelarse con una distribución lognormal. Suponga que para cierto
pesticida, la cantidad que es absorbida (en porcentaje) durante un periodo de dos
horas sigue una distribución lognormal con u = 1.5 y o = 0.5.
a) Determine la media del porcentaje absorbido
b) Determine la mediana del porcentaje absorbido.
c) Determine la probabilidad de que el porcentaje absorbido sea mayor que
d) Determine la probabilidad de que el porcentaje absorbido sea menor que 5.
e) Determine el 75o. percentil del porcentaje absorbido.
f) Determine la desviación estándar del porcentaje absorbido.
3. El índice de masa corporal (IMC) de una persona se define como la masa

corporal de una persona dividido entre el cuadrado del peso de la persona. El
artículo "Influences of Parameters Uncertainties within the ICRP 66 Respiratory
Tract Model: Particle Deposition" (W. Bolch, E. Farfan y colaboradores, en health
Physics, 2001:378-394) establece que el índice de masa corporal (en kg/m2) en
hombres entre 25-34 años sigue una distribución lognormal con parámetros u
=3.215 y o = 0.157.
a) Determine la media del IMC para hombres entre 25-34 años.
b) Determine la desviación estándar del IMC para hombres entre 25-34 años.
c) Determine la mediana del IMC para hombres entre 2534 años.
d) ¿Qué proporción de hombres entre 25-34 años tiene un IMC menor a 22?
e) Encuentre el 75o. percentil de IMC para hombres entre 25-34 años.
4. El artículo “Stochastic Estimates of Exposure and Cancer Risk from carbón

tetrachloride released to the air from the rock flats plant” modela el aumento en el
riesgo de cáncer debido a la exposición al tetracloruro de carbono como una
lognormal con u = -15.61cy o = 0.79
a) Determine la media del riesgo
b) Determine la mediana del riesgo
121
c) Determine la desviación estándar del riesgo
d) Determine el 5º. Percentil
e) Determine el 95º. Percentil
5. El artículo “Withdrawl Strenght of threaded nails” describe un experimento que
compara la resistencia final a ser retirados (en N/mm) de varios tipos de clavos.
Para un clavo con rosca anular y un vástago de diámetro de 3.76 mm introducido
en una madera de pinabete, pino y abeto, la resistencia final de retiro fue
modelada como una lognormal con u = 3.82 y o = 0.219. Para un clavo con rosca
en espiral, bajo las mismas condiciones, la resistencia se modeló como una
lognormal con u = 3.47 y 0 = 0.272
a) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca espiral?
b) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca anular?
c) ¿Con qué tipo de clavo es más probable que la fuerza de retiro sea mayor a 50
N/mm?
d) ¿Cuál es la probabilidad de que un clavo con rosca en espiral tenga una
resistencia mayor a ser retirado que la mediana de los clavos con rosca anular?
e) Se realiza un experimento en el cual se mide las resistencias a ser retirados de
diversos clavos de los dos tipos. Se registra que un clavo tiene resistencia a ser
retirado de 20 N/mm, pero no se sabe el tipo. ¿Piensa que se trata de un clavo
con rosca anular o espiral? ¿Por qué? ¿Qué tan seguro está?
Elija la mejor respuesta, y explique. Si X es una variable aleatoria con una

distribución lognormal, entonces :
i) La media de X siempre es mayor que la mediana.
ii) La medía de X siempre es menor que la mediana.
iii) La media puede ser mayor que, menor que, o igual que la mediana,
dependiendo del valor de o.
7. Los precios de acciones u otros instrumentos financieros con frecuencia se

modelan como una distribución lognormal. Un inversionista está considerando
comprar acciones en una de dos compañías, A o B. Hoy el precio de una acción
en ambas compañías es de un dólar. Para la A, el valor de la acción en un año a
partir de ahora se modela como una lognormal con parámetros µ = 0.05 y o- = 0.1.
Para la B, el valor de la acción en un año a partir de ahora se modela como una
lognormal con parámetros p. = 0.02 y o- = 0.2.
122
a) Determine la media del precio de una acción de la compañía A en un año a
partir de ahora.
b) Determine la probabilidad de que el precio de una acción de la compañía A en

un año a partir de ahora sea mayor a $1.20.
c) Determine la media del precio de una acción de la compañía B en un año a

partir de ahora.
d) Determine la probabilidad de que el precio de una acción de la compañía B en

un año a partir de ahora sea mayor a $1.20.
8. Un fabricante afirma que la resistencia a la tensión de cierto compuesto (en

MPa) tiene una distribución lognormal con 5 y u = 0.5. Sea X la resistencia de una
muestra aleatoria y representativa de este compuesto.
a) Si la afirmación es cierta, ¿a qué es igual P (X < 20)?
b) Con base en la respuesta al inciso (a), si la afirmación es cierta, ¿una

resistencia de 20 MPa sería inusualmente pequeña?
c) Si usted observa una resistencia a la tensión de 20 MPa, ¿esto sería una

evidencia de que la afirmación es falsa? Explique.
d) Si la afirmación es cierta, ¿a qué es igual P (X < 130)?
e) Con base en la respuesta al inciso d), si la afirmación es cierta, ¿una resistencia

de 130 MPa sería inusualmente pequeña?
f) Si usted observa una resistencia a la tensión de 130 MPa, ¿esto sería una
evidencia de que la afirmación es falsa? Explique.
En el apéndice 5 se busca el cuerpo de la tabla el valor más cercano a 0.4000.

Este valor es 0.3997. De acuerdo con los encabezados de ese renglón y de esa
columna, el valor de z que corresponde a esta área es 1.28, y por tanto Zo.90 =
+1.28. El signo es positivo porque el punto del percentil 90 es mayor que la media,
y por tanto el valor de z es mayor que cero, la media.
123
De acuerdo con el procedimiento del ejemplo 4 para la determinación de un punto
percentil en la distribución normal estándar, un punto percentil en una variable
aleatoria con distribución normal se determina despejando en la fórmula (7.2) X (y
no z), con lo que se obtiene:
X=u + zo
Ejemplo 5
En el caso de la vida útil del componente eléctrico que se describe en los ejemplos
2 y 3, y empleando la solución del ejemplo 4, el punto percentil 90 de vida útil del
componente es
X =zo- = 2000 + (1.28) (200) = 2256 horas
Para los puntos percentiles abajo del percentil 50, el valor de z será siempre
negativo, ya que en la distribución normal estándar este valor es menor que 0, que
es la media.
Ejemplo 6
Continuando con el ejemplo 5, suponga que se desea determinar el tiempo de vida

útil tal que sólo 10 por ciento de los componentes fallen antes de ese lapso (el
punto del percentil 10). Véase en la figura 7.6 el área correspondiente en la
distribución de probabilidad normal estándar. Igual que se hizo en el ejemplo 4, se
busca en el cuerpo de la tabla del apéndice 5 el área más cercana a 0.4000, pero
en este caso el valor de z se considera negativo. La solución es
X= zo-= 2000 + (-1.28) (200) =1744 horas
124
3.11 APROXIMACIÓN DE LA NORMAL A LA BINOMIAL
Cuando el número de observaciones o ensayos n es relativamente grande, se usa

la distribución de probabilidad normal para aproximar probabilidades binomiales.
Una regla útil es que esta estimación es aceptable cuando n>30 y tanto np >5
como nq >5, esta regla, combinada con la que se dio de la aproximación de
Poisson para probabilidades binomiales, significa que siempre que n > 30, las
probabilidades binomiales se pueden aproximar ya sea mediante la distribución
normal o la de Poisson, dependiendo de los valores de np y nq. En otros textos se
usan reglas ligeramente diferentes. El número de éxitos es
U = np
La desviación estándar es del número de éxitos es = 0 npq

En un grupo grande de posibles clientes se ha observado que 20 por ciento de
aquellos con los que un representante de ventas ha establecido contacto personal
realizarán una compra. Si un representante de ventas contacta a 30 posibles
clientes, la probabilidad de que 10 o más realicen una compra se puede
determinar utilizando las probabilidades binomiales del apéndice 2:
Ahora se revisa si se satisfacen los criterios para la aproximación normal:
La aproximación normal al valor de probabilidad binomial es
125
(Nota: Esto comprende la corrección por continuidad que se estudia a
continuación.)
En el ejemplo 7 se supone que cuando se usa la aproximación normal, la clase de

eventos "10 o más" comienza en 9.5. A este ajuste en media unidad se le llama
corrección por continuidad. Este ajuste es necesario porque toda el área bajo la
distribución normal continua tiene que asignarse a algún evento numérico, aun
cuando no sea posible un valor fraccionario de éxitos, por ejemplo, entre "9
compradores" y "10 compradores". Dicho de otra manera, en el Proceso del
empleo de la aproximación normal un evento discreto como "10 compradores"
tiene que considerarse e.°1110 un intervalo continuo de valores que va desde un
límite inferior exacto 9.5 hasta un límite superior exacto 1,03: Por tanto, si en el
ejemplo 7 se hubiera pedido la probabilidad de "más de 10 compradores", la
corrección por continuidad apropiada consistiría en sumar 0.5 al 10 y determinar el
área correspondiente al intervalo que comienza ,,1 10-5• De acuerdo con el
razonamiento anterior, el valor 0.5 se suma o se resta como corrección por
continuidad "e acuerdo con la forma de la proposición de probabilidad:
En este caso se estarán calculando probabilidades de experimentos Binomiales de

una forma muy aproximada con la distribución Normal, esto puede llevarse a cabo
si n y p = p(éxito) no es muy cercana a 0 y 1, o cuando n es pequeño y p tiene
un valor muy cercano a ½ ; esto es,

Donde:
x = variable de tipo discreto; solo toma valores enteros
 = np = media de la distribución Binomial
= = desviación estándar de la distribución Binomial

Cuando ocurren las condiciones anteriores, la gráfica de la distribución Binomial,
es muy parecida a la distribución Normal, por lo que es adecuado calcular
126
probabilidades con la Normal en lugar de con la Binomial y de una forma más
rápida.
En resumen, se utiliza la aproximación Normal para evaluar probabilidades
Binomiales siempre que p no esté cercano a 0 o 1. La aproximación es excelente
cuando n es grande y bastante buena para valores pequeños de n si p está
razonablemente cercana a ½. Una posible guía para determinar cuándo puede
utilizarse la aproximación Normal es tener en cuenta el cálculo de np y nq. Sí
ambos, np y nq son mayores o iguales a 5, la aproximación será buena.

Antes de empezar a resolver problemas con la aproximación Normal, es bueno
aclarar que se están evaluando probabilidades asociadas a una variable discreta
x, con una distribución que evalúa variables de tipo continuo como es la Normal,
Por lo que z sufre un pequeño cambio como se muestra a continuación:

¿Por qué vamos a sumar o a restar ½ a x?
Este es un factor de corrección debido a que se está evaluando una variable

discreta con una distribución continua, por lo que hay que delimitar claramente
desde que punto se va a evaluar la variable, dicho de otra forma, en que límite de
la barra (inferior o superior) nos debemos posicionar para determinar la
probabilidad requerida, cada barra de probabilidad a evaluar tiene como base la
unidad, ese es el porqué del  ½.
127
3.13 GRÁFICA
128
¿Sabías que…
En la referencia
estadística se
conoce como
muestreo a la
técnica para la
selección de una
muestra a partir
de una población
estadística.
UNIDAD 4
MUESTREO
129
4.- MUESTREO
4.1 DEFINICIÓN DE MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya
función básica es determinar que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que
se reproduzca de la mejor manera los rasgos esenciales de dicha población que
son importantes para la investigación. Para que una muestra sea representativa, y
por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la
población, es decir ejemplificar las características de ésta.
4.1.1 TIPOS DE MUESTREO ALEATORIO, SISTEMATIZADO,
ESTRATIFICADO Y CONGLOMERADO.
Muestreo aleatorio simple

El tipo que más se utiliza es un muestreo aleatorio simple.
Muestreo aleatorio simple. Una muestra seleccionada de modo que cada uno de
los elementos o personas en la población tenga las mismas probabilidades de ser
incluidos.
Para ilustrar el muestreo aleatorio simple, suponga que una población consta de
845 empleados que trabajan en Nitra Industries. Se ha de seleccionar una muestra
de 52 empleados de esa población. Una forma de asegurar que todos los
empleados tengan las mismas oportunidades de ser elegidos escribir primero el
nombre de cada uno en un papel y colocar todos los papeles en una urna. Luego
de haberlos revuelto en forma minuciosa se hace la primera selección tomando un
papel de la caja sin mirarla. Este proceso se repite hasta haber seleccionado la
muestra de 52 personas.
Un método más conveniente de seleccionar una muestra aleatoria es usar el
número de identificación de cada empleado y una tabla de números aleatorios
como la que aparece en el apéndice E. Cómo lo indica el nombre estos números
se generaron mediante un proceso aleatorio. Para cada dígito de un número, la
probabilidad de 0, 1, 2,…,9 es la misma. Por lo tanto, la probabilidad de
seleccionar al empleado número 011 es la misma para el empleado 722 o para el
número 382. El sesgo se elimina de proceso de selección.
Una parte de una tabla de números aleatorios aparece en la siguiente ilustración.
130
Para utilizar esta tabla con el propósito de seleccionar una muestra de empleados
primero se elige un Punto de partida en la tabla. El número es 03759. Debido a
que sólo hay 845 empleados se utilizarán los primeros 3 dígitos de un número
aleatorio de 5 dígitos. Por lo tanto 037 es el número de primer empleado que será
miembro de la muestra. Otra forma de seleccionar El punto de partida es cerrar los
ojos y apuntar a un número de la tabla para continuar seleccionando a los
empleados se puede mover en todas direcciones. Suponga que el movimiento es
a la derecha. Los primeros 3 dígitos de la cifra a la derecha de 03759 son 447: el
número del segundo miembro de la muestra. Los primeros tres dígitos del
siguiente número a la derecha son 96 1. Se salta este número porque sólo hay
845 empleados se continúa la derecha y se selecciona la empleada 784 luego 189
y así sucesivamente.
Un estudio de Marian Bryson y Robert Manson ilustra aún más es uso de una
tabla de números aleatorios y el muestreo aleatorio simple.
En 18 bodegas en un depósito del ejército estadounidense se encontraban 186
810 insumos militares diferentes, tales como llantas, tuercas, pernos, orugas de
tanque y rines para llantas. En cada bodega Había naves y en cada nave había
depósitos. Por ejemplo, en la bodega 17 se almacenaron partes para vehículos de
motor. La nave 260, depósito 2, contenía cigüeñales para jeeps. La nave 260,
depósito 3, tenía tapones de radiador para jeeps.
El problema suponía seleccionar un estante de una bodega al azar, y contar el
número de artículos que contenía. Luego se comparaba el conteo físico contra el
número de los registros de inventario indicaban que debería haber. Así el
problema era básicamente el inventario físico, que abarcaría varios métodos de
131
muestreo. El objetivo de proyecto de investigación consistía en determinar qué tan
precisos eran los registros. Para asegurar que cada depósito tenía las mismas
oportunidades de ser seleccionado, se empleó una tabla de números aleatorios a
fin de escoger bodega, nave y estante. Si se seleccionaba la bodega 5, nave 455,
depósito 6, un verificador iba a este lugar dar el número de artículos que estaban
en ese depósito.
¿Por qué se eligió un método tan oneroso en cuanto al tiempo para seleccionar los
depósitos que serían parte de la muestra? La otra alternativa era permitir a los
verificadores contar los artículos en cualesquiera depósitos que eligieran ellos
mismos. Sin duda los verificadores habrían evitado contar los artículos en
cualesquiera depósitos que contuvieran partes pesadas o llenas de grasa Y quizá
también había ignorado los depósitos en la parte más alta, a 6 metros por encima
del suelo del almacén. Las omisiones de los artículos en esos depósitos del
intervalo físico podrían haberse dado los resultados: es decir habría dado una
imagen falsa de la precisión de los registros.
Autoevaluación 6 – 1
La lista de clase que se encuentra en la página siguiente, enumera los alumnos
inscritos en un curso de introducción a la estadística de negocios, se seleccionará
a 3 estudiantes a quienes se les harán varias preguntas respecto del contenido y
método de instrucción del curso
a) Se escriben los números 00 a 45 en trozos de papel y se colocan en un
tazón. Los 3 números seleccionados son 31,07 y 25. ¿A qué estudiantes
se incluirán en la muestra?
b) Ahora utilice la tabla de números aleatorios, apéndice E, para seleccionar
su propia muestra.
c) ¿Qué harías si se encontrará con el número 59 en la tabla de números
aleatorios?
Muestreo aleatorio sistemático
El procedimiento de muestreo aleatorio simple puede ser difícil en ciertos casos.
Por ejemplo, suponer que la población que interesa consiste en 2000 facturas que
se localizan en cajones. Tomar una muestra aleatoria sencilla requería primero
numerar las facturas del 0000 al 1999. Utilizando una tabla de números aleatorios,
se selecciona luego una muestra de. por ejemplo 100 números. Luego en los
cajones de veras localizarse una factura que concuerde con cada uno de los 100
números. Esta área puede requerir mucho tiempo. En vez de ello se podría
seleccionar una muestra aleatoria sistemática recorriendo simplemente los
cajones, contando las facturas y tomando todas las que hagan el número 20 del
grupo, para su estudio. La primera factura debería elegirse utilizando un proceso
aleatorio: por ejemplo, una tabla de números aleatorios. Si se eligió la décima
factura como punto de partida, la muestra consistiría en las facturas décima,
trigésima, quincuagésima, septuagésima…Debido a que el primer número se elige
132
al azar todos tienen la misma posibilidad de seleccionarse para la muestra. Por lo
tanto, se trata de un muestreo probabilístico.
Muestreo aleatorio sistemático. Se acomodan los elementos o personas de la
población en cierta forma. Se selecciona un punto de partida aleatoria y luego se
toman cada k-ésimo miembro para formar parte de la muestra.
Numero Nivel Numero Nivel
aleatorio Nombre academico aleatorio academico
0 EDGARDO Segundo 23 ERASMO Segundo
1 EDITH Segundo 24 ERICO Primero
2 EDMUNDO Primero 25 ERIC Segundo
3 EDUARDO Primero 26 ERICA Segundo
4 EFRAÍN Segundo 27 ERNESTO Tercero
5 EFRÉN Tercero 28 ESMERALDA Segundo
6 ELENA Segundo 29 ESPERANZA Segundo
7 ELEONOR Tercero 30 ESTEBAN Tercero
8 ELÍAS Segundo 31 ESTEFANÍA Segundo
9 ELISA Tercero 32 ESTELA Cuarto
10 ELISABETH Cuarto 33 ESTER Segundo
11 ELOISA Cuarto 34 ETEL Segundo
12 ELOY Tercero 35 EUCLIDES Cuarto
13 ELSA Tercero 36 EUDOSIA Segundo
14 ELVIRA Segundo 37 EUDOXIO Segundo
15 EMILIA Segundo 38 EUFEMIO Segundo
16 EMILIO Segundo 39 EUFEMIA Segundo
17 EMA Tercero 40 EUFRASIO Segundo
18 EMANUEL Primero 41 EUFRASIA Segundo
19 EMILIO Segundo 42 EUGENIO Segundo
20 ENCARNACIÓN Segundo 43 EUGENIA Segundo
21 ENGRACIA Segundo 44 EULALIO Segundo
22 ENRIQUE Tercero 45 EULALIA Tercero
No obstante, no debe utilizarse un muestreo sistemático si existe un patrón o

arreglo que se relacione con elemento de interés. Por ejemplo, en el estudio de
inventario físico que se menciona antes, alguno de los almacenes en el depósito
tiene naves con una altura de 6 depósitos. En la fila inferior se encuentran los
artículos de movimientos más rápidos, como la grasa, pintura en aerosol para
retocar y artículos de ferretería. Estos artículos se colocan en el nivel de piso para
acelerar el trabajo de los despachadores que deben entregar las requisiciones. En
parte más alta se encuentran los artículos de movimiento más lento, como rines
para llantas, orugas para tanques y percutores para gatillos. En las cuatro filas
intermedias están los artículos de movimiento de rapidez moderada, como llantas,
faros para automóviles y chavetas. Si se utiliza el muestreo sistemático para
verificar el inventario, entonces es muy posible que elijan una muestra sesgada.
Suponga que el procedimiento de muestreo pedía que se hicieron una selección
de cada tres depósitos y primero que se elige es el depósito número uno. Luego
se selecciona sistemáticamente los depósitos 1, 4, 7, 10 ,13 ,16, 19 ,22.
133
Este procedimiento sistemático seleccionó 4 depósitos llenos con artículos de
movimiento relativamente rápido, y otros cuatro que están llenos con artículos de
movimiento rápido o lento. La división por Mitades de la muestra no coincide con
las características reales de la población. La población consiste en 16 depósitos
con movimientos de relativa rapidez y 4 de artículos de movimiento rápido o lento.
Sin duda el resultado de la muestra estaría insesgados hacia los artículos de
movimiento rápido o lento.
Muestreo aleatorio estratificado
Otro tipo de muestreo probabilístico es el muestreo aleatorio estratificado
Muestreo aleatorio estratificado: se divide la población en subgrupos llamados
estratos y se selecciona una muestra de cada uno de ellos.
Una vez que la población se divide en estratos, es posible seleccionar una
muestra proporcional y no proporcional. Como nombre no implica, un
procedimiento de muestra proporcional requiere qué número de artículos de cada
estrato esté en la misma proporción que en la población. Por ejemplo, el problema
podría ser estudiar los gastos de publicidad de las 352 empresas estadounidenses
mayores. Suponer que el objetivo del estudio consiste en determinar si las
empresas con altos rendimientos sobre su inversión (una medición de rentabilidad)
han gastado una mayor proporción de sus presupuestos de ventas en publicidad
que las empresas que tienen un menor rendimiento o incluso un déficit. Suponer
que las 352 empresas se dividen en 5 estratos (véase la ilustración) si se han de
seleccionar para su estudio intensivo por decir 50 empresas entonces se debería
incluir una empresa con nivel de rentabilidad de 30% o más cinco empresas en el
estrato de 20 a 30% se seleccionan al azar, etcétera.
En una muestra estratificada no proporcional, la cantidad de artículos que se
seleccionan en cada estrato no guarda proporción con los números respectivos en
la población. Independientemente de que se usa en un procedimiento de muestra
proporcional o no proporcional, cada elemento o persona la población tiene la
misma oportunidad de que se seleccionan para muestra.
134
En algunos casos, el muestreo estratificado tiene la ventaja de poder reflejar con
mayor precisión las características de la población que un muestreo aleatorio
simple sistemático. Observa en la instrucción que el 2 por ciento de las empresas
tienen un rendimiento sobre la inversión de 30 por ciento o más (estrato 1) y el 1%
por ciento tiene un déficit (estrato 5). Si se tomara una muestra aleatoria simple de
50 empresas quizás por azar no se había seleccionado ninguna empresa en los
estratos 1 0 5. Una muestra aleatoria estratificada aseguraría que al menos una
empresa del estrato 1 y otra es el estrato 5 están representadas en la muestra.
ILUSTRACION 6-1 número seleccionado para una muestra aleatoria

estratificada proporcional
Rentabilidad
Estrato (rendimiento Numero de Numero
sobre la inversion) firmas Muestreado Se encuentra por
1 30 por ciento y más 8 1 8/352 x 50
2 De 20 a 30 por ciento 35 5 35/352 x 50
3 De 10 a 20 por ciento 189 27 189/352 x 50
4 De 0 a 10 por ciento 115 16 115/352 x 50
5 Déficit 5 1 5/352 x 50
Total 352 50
Muestreo por conglomerados

Otro tipo común de muestreo el muestreo por conglomerados. Muchas veces se le
emplea para reducir el costo de realizar un muestreo de la población dispersa en
una gran área geográfica. Suponga que desea determinar el punto de vista de los
industriales de Texas, sobre las políticas federales y estatales de la protección del
entorno. La selección de muestra aleatoria de las Industrias de Texas y el contacto
personal con cada uno de ellos sería un muy onerosos en cuanto a tiempo y
dinero. En lugar de ello se podrá emplear el muestreo por conglomerados
subdividiendo el estado de las unidades pequeñas de afuera con dados o
regiones. Muchas veces, estas se conocen como unidades primarias Supongo que
se subdividió el estado de Texas Con 12 unidades primarias y luego escogió
cuatro de ellas: las marcadas con números 2,7,4 y 12 y se concentró el esfuerzo
estas unidades primarias. Usted podría tomar una muestra aleatoria de los
industriales en cada una de estas regiones y los entrevistaría (observe que se
trata de una combinación de muestreo por conglomerados y un muestreo aleatorio
simple).
135
La discusión de los métodos de muestreo en las elecciones presidente concluyó la
totalidad de los métodos de muestreo que se dispone un investigador. Cuando se
toma parte de un proyecto de investigación en mercadotecnia finanzas
contabilidad u otras áreas, quizá se requiera consultar libros dedicados una
manera exclusiva la teoría y el diseño muestras.
Autoevaluación 6 – 2
Haga referencia a la autoevaluación y la lista de clase de la página pasada.
Suponga que una muestra consistirá en cada noveno estudiante inscrito en clase.
Al principio se selecciona al azar al cuarto estudiante de la lista. Ese estudiante
tiene el número 03. Recordando que los números aleatorios comienzan con 00,
¿Qué estudiantes se seleccionará para ser miembro de la muestra?
Ejercicios
1.-A continuación, se enumeran los 35 miembros de la asociación de distribuidores
de automóviles el área metropolitana de Tulsa Oklahoma.
136
Numero de Distribuidor Número de Distribuidor
identificación identificación
0 Bravo Guzmán 18 Kenia Cabrera
1 Amira torres 19 Airam morales
2 José Fernández 20 Yazmin López
3 Isamar Gutiérrez 21 Andrea Padilla
4 Rosa Itzel 22 José Reyes
5 David Márquez 23 María del Rosario
6 Gustavo Aguilar 24 Antonio Ramírez
7 David Sámano 25 Karen Moreno
8 Lucero Fernández 26 Melany Hernández
9 Diana Covarrubias 27 Josué Cruz
10 Ernesto Pérez 28 Omar Arellano
11 Virginia Muñoz 29 Alfredo Aldazaba
12 José Rogel 30 Gerardo Ortiz
13 Iban Bravo 31 Jenifer López
14 Kimberly Contreras 32 Yaremi Cortez
15 Liliana Castañeda 33 Mariana Córdoba
16 Adriana Flores 34 Felicia Martínez
17 María Salazar 35 Adolfo Patlani
Número de identificación distribuidor número de identificación distribuidor

a) Se desea seleccionar una muestra aleatoria de 5 agentes distribuidores.
Los números aleatorios son 05, 20, 59, 21, 31, 28, 49, 38, 66,08, 29 y 02.
¿Qué distribuidores quedarían en la muestra?
b) Utilice el cuadro de números aleatorios para seleccionar una muestra
personal de cinco distribuidores.
c) Una muestra a de consistir en un distribuidor de cada grupo de 7. Se
selecciona el número 04 como Punto de partida ¿Qué distribuidores se
incluyen en la muestra?
A continuación, se enumeran los 27 agentes de seguros de Nationwidelinsurance
el área de la ciudad de Toledo Ohio.
Numero de Distribuidor Número de Distribuidor
Identificación identificación
0 Bravo Guzmán 12 Kenia Cabrera
1 Amira torres 13 Airam morales
2 José Fernández 14 Yazmin López
3 Isamar Gutiérrez 15 Andrea Padilla
4 Rosa Itzel 16 José Reyes
5 David Márquez 17 María del Rosario
6 Gustavo Aguilar 18 Antonio Ramírez
7 David Sámano 19 Karen Moreno
137
8 Lucero Fernández 20 Melany
Hernández
9 Diana Covarrubias 21 Josué Cruz
10 Ernesto Pérez 22 Omar Arellano
11 Virginia Muñoz 23 Alfredo Aldazaba
a) Se desea una muestra aleatoria de 4 agentes los números aleatorios son

02, 59,51, 25,14, 29,77, 69, 08 y 18 ¿Qué agentes se incluirán en la
muestra?
b) Utiliza el cuadro de números aleatorios para seleccionar una muestra
personal de 5 agentes
c) Una muestra debe consistir en una gente de cada 5 elige el número 2 como
Punto de partida ¿Qué agentes deberán estar incluidos en la muestra?
Error en el muestreo
El análisis anterior acentúa la importancia de seleccionar una muestra a fin de
que todos los artículos de la muestra tengan la misma oportunidad de ser
elegidos. Para lograr esto, se puede seleccionar una muestra aleatoria simple, una
muestra sistemática, una muestra estratificada, una muestra por conglomerado o
una combinación de estos métodos. Sin embargo, es improbable que la media de
la muestra fuera idéntica a la media de la población.
Asimismo, talvez la desviación estándar otra medición que se calcula con base en
la muestra no sea Exactamente igual al valor correspondiente de la población. Así
es posible que existan ciertas diferencias entre las estadísticas de la muestra
como la media y la desviación estándar de la muestra y los parámetros de la
población correspondiente. La diferencia entre un estadístico de la maestra y un
parámetro de la población se conoce como error de muestreo.
Error de muestreo. Diferencia entre un estadístico de la muestra y el parámetro
correspondiente de la población.
Suponga que las calificaciones de eficiencia de una población de 5 empleados de
producción fueron 97, 103, 96,99 y 105. Asimismo, se pongan que una muestra de
dos calificaciones, 97 y 105, es seleccionada para calcular la media de la muestra.
Está sería 101 que se obtiene mediante 97 más 105 entre 2 otra muestra de 2
calificaciones sería 103 y 96 con una media de muestra de 99.5 la medida de
todas las calificaciones es decir la media de la población es 100 que se encuentra
mediante: (93 +103+96+99 +105) / 5= 100 . El error de muestreo de la primera
muestra es de 1.0 que se determina por x-µ= 101- 100. La segunda muestra tiene
un error de muestreo de -0.5. Ambas diferencias 1.0 y -0.5 son errores que se
138
cometen al estimar la media de la población mediante una media de muestra y sus
errores de muestreo deben al azar. Los tamaños de estos errores varían de una
muestra a otra
4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA
La distribución muestral de un estadístico es una distribución de probabilidad
constituida por cada uno de los valores que puede asumir el estadístico en todas
las muestras de tamaño n posibles de extraer sin reposición en una población de
tamaño N. Dados los valores de la población y la muestra el número de muestras
posibles a extraer se calcula como combinación.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una
población grande. Se calcula la media muestral X para cada muestra; la colección
de todas estas medias muestrales recibe el nombre de distribución muestral de
medias.
La distribución muestral de las medias muéstrales asume como la media el valor
del parámetro poblacional µ y la desviación típica de la distribución muestral de
medias- denominado error estándar o error típico.
Error estándar de la media: Es la desviación estándar de la distribución de
muestreo de la media, por lo que mide el grado en que se espera que varíen las
medias de las diferentes muestras de la media de la población, debido al error
aleatorio en el proceso de muestreo.
El Teorema del Límite Central también nos indica que cuando se extraen muestras
de tamaño mayor a 30 o bien de cualquier tamaño pero provenientes de una
población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución
normal con:
Puede conocerse empíricamente, según se ha visto, efectuando dos operaciones.
A saber, extrayendo todas las muestras posibles de tamaño n de una población de
tamaño N y calculando para cada muestra la media y probabilidad asociada.
Población y muestras inferencia estadística

En la práctica estamos interesados en extraer conclusiones válidas respecto a un
grupo grande de individuos u objetos. En cambio de examinar un grupo entero,
llamado la población, lo cual puede resultar difícil o imposible, videos de examinar
solamente una parte pequeña de esta población, qué se llama la muestra. Se hace
con el propósito de inferir ciertos hechos respecto de la población de los
resultados hallados en la muestra, un proceso conocido como inferencia
estadística. El proceso de obtener muestras se llama muestreo.
139
Ejemplos 5.1 desearíamos extraer conclusiones respecto a las estaturas de 12000
estudiantes examinando solamente 100 estudiantes seleccionados de esta
población.
Ejemplo 5.2 desearíamos extraer conclusiones respecto al porcentaje de tornillos
defectuosos producidos en una fábrica durante una semana de 6 días examinando
20 tornillos diariamente producidos en tiempos diferentes durante el día. En este
caso los tornillos producidos durante la semana conforman la población en tanto
que los 120 tornillos Escogidos constituyen la muestra.
Ejemplo 5.3 desearíamos extraer conclusiones respecto a la honradez de una
moneda determinada a lanzar repetidamente. La población consiste en todos los
lanzamientos posibles de la moneda. Se podría obtener una muestra al examinar,
por ejemplo, los primeros 60 lanzamientos de la moneda notar caras y sellos.
Ejemplos 5.4 Desearíamos extraer conclusiones Respecto a los colores de 200
bolas en una urna una muestra de 20 bolas de la urna, donde cada bola
seleccionada se regresa luego de observar su color.
Deben notarse varias cosas. Primero la palabra población no tiene
necesariamente el mismo significado como en el lenguaje común, como en " la
población de determinada ciudad es de 180.000".
Segundo, la palabra población se utiliza para denotar Las observaciones o
medias y no los individuos u objetos. Así en él ejemplo 5.1 podemos hablar de la
población de 12,000 estaturas, en tanto que en el ejemplo 5.4 podemos hablar de
la población de todos los 200 colores en la urna.
Tercero la población puede ser finita o infinita, el número se llama el tamaño de la
población, comúnmente denotado por N. En forma semejante el número de la
muestra se llama el tamaño de la muestra, denotado por n, generalmente finito. En
el ejemplo 5.1, N= 12,000, n= 100 mientras que en el ejemplo 5.3 N= infinito n=60.
Muestreo con y sin remplazamiento
Sí, extremos un objeto de una urna, tenemos la alternativa de colocarlo o no en la
urna antes de una segunda extracción. En el primer caso puede seleccionarse un
objeto determinado una y otra vez, mientras que en el segundo caso solamente
puede seleccionarse una vez. El muestreo donde cada miembro de una población
puede seleccionarse más de una vez se llama muestreo con reemplazamiento,
mientras que si cada miembro no puede seleccionarse más de una vez se llama
muestreo sin reemplazamiento.
Por simplicidad supongamos que el muestreo es con remplazamiento de modo
que el mismo individuo podría conceptualmente escogerse más de una vez. En
este caso ya que con el tamaño de la muestras es mucho más pequeño que el
140
tamaño de la población, el muestreo sin remplazamiento daría realmente los
mismos resultados que el muestreo con remplazamiento.
En el caso general una muestra de tamaño n se describiría por los valores x 1, x2,…,
xn de las variables aleatorias X1, X2,…, Xn. En el caso de muestreo con
remplazamiento X1, X2,…, Xn. serian variables aleatorias independientes distribuidas
idénticamente con distribución de probabilidad f (x). Entonces su distribución
conjunta seria
P(X1=x1, X2=x2…, Xn=xn)= f(x1) f(x2)…. f (xn).
Cualquier cantidad obtenida de una muestra con el propósito de estimar un

parámetro de poblacional se llama estadísticos muéstrales o brevemente
estadísticos. Matemáticamente, un estadístico muestral para una muestra de
tamaño n puede definirse como función de las variables aleatorias X 1, X2,…, Xn, es
decir g(X1,,…, Xn). La función g(X1…, Xn) es otra variable aleatoria cuyos valores
pueden representarse por g(x1…, xn).La palabra estadístico se emplea
fundamentalmente para la variable aleatoria o para sus valores, en el sentido
determinado se deduce lógicamente del contexto.
En general, correspondientemente a cada parámetro poblacional habrá un
estadístico a calcularse e la muestra. Comúnmente el método para obtener un
estadístico de la muestra es semejante al de obtener el parámetro de una
población finita, ya que una muestra consiste de un conjunto finito de valores. Sin
embargo, como veremos esto no siempre produce el “mejor estimador” y uno de
los problemas importantes de la teoría del muestreo es decidir como formar el
estadístico muestral apropiado que mejor estime un parámetro poblacional dado.
Tales problemas de consideran en capítulos posteriores.
Donde sea posible trataremos de utilizar letras griegas tales como µ, α, etc. Para
los valores de parámetros poblacionales y letras romanas m,s,etc, para valores del
correspondiente estadístico muestral.
DISTRIBUCION MUESTRAL
Cálculo de la media muestral
Denótese por X1, X2,…, Xn las variables aleatorias para una muestra de tamaño n
como se describe anteriormente. Entonces la media de muestra o media
muestral es una variable aleatoria definida por:
X 1+ X 2+… .+ Xn
x=
n
En analogía si x1, x2,…, xn denotan los valores obtenidos en una muestra especifica
de tamaño n entonces la media para esa muestra se denota por
141
x 1+ x 2 … .+ xn
x=
n
Ejemplo 5.5. Si una muestra de tamaño 5 resulta en los valores muéstrales 7, 9, 1,

6,2 entonces la media muestral es:
7+9+1+ 6+2
x= =5
6
Distribución muestral de medias
Sea f(x) la distribución de la probabilidad de alguna población dada de la cual
extraemos una muestra de tamaño n. Entonces es natural buscar la distribución de
probabilidad del estadístico muestral x, que se llama la distribución muestral
para la media de la muestra o la distribución muestral de medias. Los
teoremas siguientes son importantes en este sentido.
Teorema 5.1 La media de la distribución muestral de medias, denotada por μ X, está dada por
E ( x ¿=¿ μ X= μ
Donde μ es la media de la población.
El teorema 5.1 establece que el valor de la media muestral es la media de la población.
142
Teorema 5.2 Si una población es infinita o si el muestreo es con remplazamiento, entonces la
varianza de la distribución muestral de medias, denota por α2 x́ esta dada por
α2
E [ ( X −μ )2]=
n
donde α 2 es la varianza de la población
Teorema 5.3 Si la población es de tamaño N, si el muestreo es sin remplazamiento y si el

tamaño de la muestra es n≤N, entonces (5) se remplaza por
α 2 α 2 N −n
= ¿ )
n n N−1
Nótese que (6) se reduce a (5) cuando N=∞
Teorema 5.4 Si la población de la cual se toman las muestras tiene una distribución de
probabilidad con media μ y varianza α2 entonces la media muestral esta normalmente
distribuida con media μ y varianza α^2/n
Teorema 5.5 Si la población de la cual se toman las muestras tiene una distribución de
probabilidad con media μ y varianza α2 que no necesariamente tiene una distribución normal.
Entonces la variable tipificada asociada con X, dada por
Z= ( X ̅-μ)/( α/√n)
Es normal asintóticamente, esto es
El teorema 5.5 es una consecuencia del teorema del límite central página 112. Se
supone aquí que la población es infinita o que el muestreo es con remplazamiento.
De otra forma lo anterior es correcto si remplazamos α / √ n en (7).
143
4.2.1 DISTRIBUCION MUESTRAL DE LA MEDIA CON VARIANZA
DESCONOCIDA Y CONOCIDA
El comportamiento de la media muestral y ésta depende tanto del valor de la

media poblacional, como de la varianza poblacional, parece lógico pensar que si
nuestro interés radica en inferir comportamientos de la población partiendo de la
muestra parece ilógico pensar que conozcamos la varianza
De ahí la importancia de establecer una distribución para la media muestral que la
relacione únicamente con la poblacional, lo que hará que conocida la muestral
concreta podamos aventurar el comportamiento de la poblacional.
Una distribución muestral de medias o una distribución en el muestreo de la media
se define como el conjunto de todas las medias que se pueden calcular en todas
las muestras posibles que se pueden extraer, con o sin reemplazo, de una
determinada población.
En apartados anteriores estudiamos el comportamiento de la media muestral y

vimos que ésta dependía tanto del valor de la media poblacional, como de la
varianza poblacional , parece lógico pensar que si nuestro interés radica en inferir
comportamientos de la población partiendo de la muestra parece ilógico pensar
que conozcamos la varianza . De ahí la importancia de establecer una distribución
para la media muestral que la relacione únicamente con la poblacional, lo que hará
que conocida la muestral concreta podamos aventurar el comportamiento de la
poblacional.
DISTRIBUCIÓN DE LA MEDIA MUESTRAL
CUANDO SE CONOCE LA VARIANZA POBLACIONAL

Sea (x 1 , x 2 ,....., x n ) una muestra aleatoria de tamaño n, procedente de una población N  ,  ;
Entonces la distribuci ón del estadístic o media muestral tendrá una distribuci ón normal 
Si X  N  ,   
  
X  N  , 
 n
Si X  ¿   ,  
  
T .C.L.  Si n  30  X  N  , 
 n
X-
  N  0,1

n
144
Considere una población cuyo comportami ento está caracteriz ado por el de una v.a. N( ,  )
N(50,100). Si de tal población se toma una muestra de tamaño n  25. Calcular :
1) La probabilid ad de que X  60
2) P(48  x  51)
 100 
X  N (50,100)  X  N 50, 
 25 
Distribución de la media muestral cuando no se conoce la varianza

poblacional
  
 ,
X  N 

 n 
X  
 N (0,1)

n

si no se conoce  
X  
 si n es grande  N(0,1)
S
n
X  
 si n es pequeño t n -1
S
n
" grados de libertad"
145
4.2.2 DISTRIBUCION MUESTRAL DE LA DIFERENCIA ENTRE DOS MEDIAS
CON VARIANZA DESCONOCIDA Y CONOCIDA
Distribución de la diferencia de medias muestrales cuando se conoce la

varianza poblacional
“Sean (x1....xn) e (y1…..yn) dos muestras aleatorias simples e independientes de
tamaños nx y ny procedentes de N(μx,σx) y N(μy,σy) respectivamente. Entonces
la distribución muestral de la diferencia de medias se distribuye:
 x  y  x   y
 x2  y
2
 xy   
nx n y
  x2  y 
2
x  y  N  x   y ,  
 nx n y 
 
( x  y )   x   y 
 N (0,1)
 2
 y2
x
nx n y
146
147
Distribución de la diferencia de medias muestrales cuando no se conoce la
varianza poblacional
MODELO MATEMATICO
Un agricultor utiliza una semilla híbrida que produce 90 Tm. Por hectárea y un
productor le ofrece una semilla también híbrida que produce 110 Tm. por Hora. En
5 parcelas diferentes se siembran las dos semillas:
1 2 3 4 5
HIBRIDO 90 85 95 76 80
1
HIBRIDO 97 82 102 94 78
2
148
¿Cuál es la probabilidad de que con el nuevo híbrido la producción media sea
15Tm. mayor que la antigua?
4.2.3 DISTRIBUCION MUESTRAL DE LA PROPORCION
Si una población es infinita y distribuida binomialmente, si p y q= 1-p son las

probabilidades respectivas de que un miembro dado exhiba o no exhiba una
propiedad determinada. Por ejemplo la población puede ser los posibles
lanzamientos de una moneda honrada, en el que la probabilidad de que cada
suceso es p=1/2.
Considere las posibles muestras de tamaño n extraídas de esta población y para
cada muestra determinar el estadístico que es la proporción P de éxitos. En el
caso de la moneda P seria la proporción de caras que resulten en n lanzamientos.
Entonces obtenemos una distribución muestral de proporciones cuya media μp
y desviación típica αp están dadas por
pq p(1− p)
μp =p αp ¿
√ √
n
=
n
Que pueden obtenerse de (4) y (5) al colocar μ=p, αp ¿ √ pq
Para grandes valores de n(n≥30) la distribución muestral está muy próxima a una
distribución normal , como se ve en el teorema 5.5
149
Para poblaciones finitas en las que el muestreo es sin remplazamiento, la segunda
ecuación en (9) se remplaza por αx́ como se da por (6) con ,α ¿ √ pq .
Nótese que las ecuaciones (9) se obtienen mucho más fácilmente al dividir por n la
media y la desviación típica (np y √ npq )de la distribución binomial.
4.2.4 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS
PROPORCIONES
Se nos dan dos poblaciones. Por cada muestra de tamaño n 1 extraída de la

primera población computemos un estadístico S 1 . Esto resulta en una distribución
muestral para S1 cuya media y desviación típica denotamos por μ s1 y αs1,
respectivamente. En forma semejante por cada muestra de tamaño n, extraída de
la segunda población computamos un estadístico S 2 cuya media y desviación
típica son μs2 y αs2 respectivamente.
Tomando las posibles combinaciones de estas muestras de las dos poblaciones
podemos obtener una distribución de las diferencia, S 1 – S2, que se llama la
distribución muestral de la diferencia de estadísticos. La media y la desviación
típica de esta distribución muestral denotada respectivamente por μ s1-s2 y αs1-s2,
están dadas por :
μs1-s2= μs1 - μs2 αs1-s2 =√ α s 12+ α s 22 (10)
Dado que las muestras escogidas en ninguna forma dependan entre sí, es decir
que las muestras son independientes (en otras palabras las variables aleatorias S 1
y S2 son independientes).
Si por ejemplo S1 y S2 son las medias muéstrales de dos poblaciones, denotadas

por X 1 y X 2 respectivamente, entonces la distribución muestral de la diferencia
de las medias está dada para poblaciones infinitas con media y desviación típica
μ1, α1 y μ2, α2 respectivamente por
μx 1- x 2= μx 1- μx 2 = μ1 – μ2, αx 1- αx 2 = √ α x 12+α x22=
(11)
Utilizando (4) y (5). Este resultado también es válido para poblaciones finitas si el
muestreo es con remplazamiento. La variable tipificada
(12)
150
En tal caso tiene casi una distribución normal si n 1 y n2 son grandes (n1, n2 ≥30).
Resultados semejantes pueden obtenerse para poblaciones finitas en las que el
muestreo es sin remplazamiento (4) y (6)
Resultados correspondientes pueden obtenerse para distribuciones muestrales de
diferencias de proporciones de dos poblaciones distribuidas binomialmente con
parámetros p1,q1 y p2 y q2 respectivamente . En este caso S1 y S2 corresponden a
las proporciones de éxitos P1 y P2 y las ecuaciones (11) resultan
(13)
En cambio de tomar diferencias de estadísticos algunas veces estamos

interesados en la suma de estadísticos. En tal caso la distribución muestral de la
suma de estadísticos S1 y S2 tiene media y desviación típica dada por
(14)
Suponiendo que las muestras son independientes. Se pueden obtener resultados

semejantes a (11)
Aplicaciones de la distribución muestral de diferencia de proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse

utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:

Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de
los que aprueban inglés?

Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de
ese tipo?
Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones

gerenciales?
Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la

máquina A los que genera la máquina B?
151
4.3 TEOREMA DEL LIMITE CENTRAL
En esta sección se examinará el teorema del límite central. Su aplicación a la

distribución muestral de las medias de muestras, que se presentó anteriormente,
permite utilizar la distribución de probabilidad normal para crear intervalos de
confianza para la media de la población. El teorema del límite central afirma que,
para grandes muestras aleatorias, la distribución muestral de las medias de
muestras está más próxima a una distribución de probabilidad normal. La
aproximación es más precisa para muestras grandes. Esta es una de las
conclusiones más útiles en estadística. Es posible razonar sobre la distribución
muestral de las medias de muestras sin contar con información alguna sobre la
forma de distribución origina de la que se toma la muestra. En otras palabras, el
teorema del límite central es válido para todas las distribuciones.
Un enunciado formal del teorema del límite central es el siguiente:
Teorema del límite central. Si en cualquier población se seleccionan muestras
de un tamaño especifico, la distribución muestral de las medias de muestras es
aproximadamente una distribución normal. Esta aproximación mejora con
muestras de mayor tamaño.
Diagrama 7-2: Antigüedad de servicio de los empleados de SpenceSprockes,

Inc.
152
Si la población tiene una distribución de probabilidad normal, entonces, para
cualquier tamaño de muestra la distribución del muestreo de la media también
tendrá una distribución normal. Si la distribución de la población es simétrica (pero
no normal), se verá que surge la forma normal como lo establece el teorema del
límite central aún con muestras tan pequeñas como tamaño 10. Por otra parte, si
se toma una distribución que esté sesgada o tenga extremos muy gruesos, quizá
requiera muestras de al menos 30 para observar las características de normalidad.
La mayoría de los estadísticos coincidirán que una muestra de 30 es lo bastante
grande para poder emplear el teorema del límite central.
La idea de que la distribución de medias de muestras de una población que no sea
normal convergerá a la normalidad se ilustra en los diagramas 7-2, 7-3 y 7-4. Este
ejemplo se analizará con mayor detalle dentro de poco, pero el diagrama 7-2 es
una gráfica de una distribución de probabilidad discreta que tiene el sesgo
positivo. Existen muchas muestras posibles de 5 que podrían seleccionarse de
esta población. Suponga que seleccionan al azar 10 muestras de cinco artículos
cada una y se calcula la media de cada muestra. Estos resultados se ilustran en el
diagrama 7-3. Observe que la forma de la distribución de las medias de la muestra
cambio de la población original aunque sólo se hubieran seleccionado 10 de las
muchas muestras posibles. Dicho de otra manera, se seleccionaron 10 muestras
aleatorias de 5 integrales cada una, de una población que tiene un sesgo positivo
y se descubrió que la distribución de las medias de la muestra ha cambiado de la
forma de la población. A medida que se tomen más muestras, se descubrirá que la
distribución de las medias de la muestra se acercará a la distribución normal. El
diagrama 7-4 es un histograma que muestra los resultados de 30 muestras
aleatorias de 5 observaciones de la misma población. Observe la clara tendencia
hacia una distribución normal. Esto es lo que establece el teorema del límite
central. El ejemplo siguiente hará resaltar esa condición.
Diagrama 7-3: Antigüedad media del servicio de 10 muestras de cinco

empleados de SpenceSprockets, Inc.
153
Diagrama 7-4: Histograma de la antigüedad media de servicio para 30
muestras de empleados de SpenceSprockets, Inc.
Ejemplo:
Ed Spence comenzó su empresa de engranes hace 20 años. Con el paso del
tiempo, la empresa creció y hoy en día emplea a 40 personas. SpenceSprockets,
Inc, enfrenta algunas importantes decisiones respecto a la salud de estos
empleados. Antes de tomar una decisión sobre el plan que debería adquirir, Ed
decide formar un comité de 5 representantes de los empleados. Se pedirá a
comité que estudie con cuidado la cuestión del plan de salud y haga una
recomendación sobre el plan que mejor se ajuste a las necesidades de los
empleados. Ed siente que las opiniones de los empleados más jóvenes hacia el
cuidado de su salud pueden diferir de los empleados de mayor edad. Si Ed
selecciona al azar su comité, ¿Qué puede esperar en cuanto a la media de años
de servicio de SpenceSprockets para los integrantes del comité? ¿De qué manera
la forma de la distribución de los años de antigüedad de todos los empleados se
compara con la forma de distribución de muestreo de la media? Los años de
servicio (redondeados a años completos) de los 40 empleados de hoy en día
están en la nómina de SpenceSprockets, Inc., son como sigue:
11 4 18 2 1 2 0 2 2
4
3 4 1 2 2 3 3 19 8 3
7 1 0 2 7 0 4 5 1
14
16 8 9 1 1 2 5 10 2 3
Solución
En un diagrama ilustra la distribución de los años de experiencia de los 40
empleados actuales. Observe que la distribución de los años de servicio tiene un
sesgo positivo. Existen algunos empleados que han trabajado en
154
SpenceSprockets durante cierto tiempo. Específicamente, seis empleados han
trabajado en la empresa diez años más. Sim embargo, debido a que la empresa
ha crecido, el número de empleados se ha elevado en los últimos años. De los 40
empleados, 18 han estado en la empresa por 2 años o menos.
Hay que considerar el primero de los problemas de Ed Spence. Quiere formar un
comité de cinco miembros para analizar la cuestión del cuidado de la salud y
sugerir el tipo de seguro que sería el más apropiado para la mayoría de los
trabajadores. ¿Cómo debería seleccionar el comité?
Para comenzar Ed anota los años de servicio de los 40 en un papel y los poner en
una vieja gorra de beisbol. A continuación, resuelve los papeles y toma al azar
cinco de ellos. Los años de servicio de estos 5 empleados son: 4, 1, 0, 14 y 19.
Así, la antigüedad media para estos cinco empleados es 5.60 años. ¿Cómo se
compara con la media de la población? En este momento Ed no conoce la media
de la población, pero el número de empleados es de sólo 40, de modo que decide
calcular la antigüedad media de servicio para todos los empleados. Es 4.80 años,
que se encuentra sumando los años de servicio para todos los empleados y
dividiendo el total entre 40. Es decir µ= (11+4+18+…+2+3)/40=192/40=4.80. La
diferencia de la media de la muestra, X y la media de la población, µ, es el error de
muestreo. En otras palabras, la diferencia de 0.80 años entre la media de la
población y la media de la muestra de 5.60, es el error de muestreo. Esto se debe
al azar. Así, si Ed hubiera seleccionado a 5 empleados para formar el comité, la
antigüedad media del servicio sería un poco mayor a la media de la población.
¿Qué ocurría si Ed devolviera los 5 trozos de papel a la gorra de beisbol y
seleccionara otra muestra? ¿Esperaría usted que la media de esta segunda
muestra fuera exactamente la misma que la anterior? Suponga que Ed toma otra
muestra de 5 empleados y descubre que las antigüedades de servicio de esa
muestra son 8, 3, 11 y 14. La media de esta muestra es de 5.40 años. El resultado
de seleccionar 10 muestras, de 5 empleados cada una, se ilustra en el diagrama
pasado. Vea la diferencia de la forma de la población y la distribución de las
medias de la muestra. La población de antigüedades de servicio para los
empleados tiene un sesgo positivo pero la distribución de estas 10 medias no
refleja el mismo sesgo positivo. De hecho, tiene uno negativo.
La ilustración 7-5 muestra los resultados de seleccionar 30 muestras de más de 5
empleados cada una, y calcular las medias de estas muestras. Estas medias de
muestra se organizar entonces en un histograma (diagrama 7-4). Compare la
forma de este polígono de frecuencia con la población de empleados del diagrama
7-2. Es preciso que observe dos importantes características:
1. La forma de la distribución de 30 muestras es diferente de la población. En
el diagrama 7-2, la distribución de todos los empleados tienen un sesgo
positivo. Sin embargo, la distribución muestral de las medias de muestras,
diagrama 7-4, está más próxima a una distribución normal. Esto ilustra el
teorema del límite central.
155
Ilustración 7-5: Muestras aleatorias y medias de muestra de 30 muestras de cinco
empleados de SpenceSprockets, Inc.
2. Existe menos dispersión en la distribución muestral de las medias de
muestras que en la distribución de la población. En la población, la
antigüedad de servicio iba de 0 a 19 años. En la distribución muestral de
medias de muestras, estas últimas iban de 2.2 sólo 9.2 años.
156
También es posible comparar la media de las medias demuestras con la media
de la población. La media de las 30 muestras se presentaron en la ilustración
7-5 es 4.7133 años, que se encuentra mediante µ x=(5.6+5.4+…9.2+7.0)/30.
Se usa el símbolo µ x la media de las medias de muestra. El subíndice se
recuerda que se trata de una distribución de medias de muestras. Se lee “mu
subíndice x con barra”. Se observa que la media de medias de muestras,
4.7133 años, es muy próxima a la media de población de 4.80 años.
¿Qué se puede concluir de este ejemplo? El teorema de límite central indica
que, independientemente de la forma de población, la forma muestral de las
medias de muestra se aproximará a la distribución normal. Mientras mayores
sean las muestras, mayor será la convergencia. SpenceSprockets, Inc, es una
evidencia empírica del funcionamiento del teorema del límite central. Esta
ilustración comienza con una población con sesgo positivo. A continuación, se
eligió un pequeño número de muestras y se observó una distribución de
medias de muestra. Se podría observar un cambio en la forma de la población
para la distribución de medias de muestra. Cuando se aumenta el número de
muestras de 10 a 30, se comienza a ver la característica de la normalidad. La
forma de la distribución de 30 medias de muestra que se representaron en el
diagrama 7-4 claramente tiende hacia a una distribución normal a medida que
aumenta el tamaño de la muestra.
El teorema del límite central no dice nada de la dispersión de la distribución de
medias de muestras, con la medida de la población. Sin embargo, en el
ejemplo-solución, se observó que hay menos dispersión en la distribución de
medias de muestra que en la población al comparar el rango de la población y
el de las medias de muestra. También se observó que en la media de todas las
medias de muestra estuvo muy cerca de las medias de población.
Es posible demostrar que si la dispersión en la población es σ, la dispersión en
las medias de la muestra es σ/ √ n , donde n es el tamaño de la muestra. Con
base en esta relación, es posible ver que, a medida que aumenta el tamaño de
la muestra disminuye la dispersión de las medias de las muestras. También es
posible demostrar que la media de la población es exactamente igual a la
medida de todas las medias de las muestras. Dicho de otra forma, la media de
todas las medias es igual a la media de la población.
El teorema del límite central: un segundo ejemplo.
Ejemplo
El ejemplo anterior proporciona cierta idea de la importancia del teorema del
límite central. No obstante, vale la pena considerar otro ejemplo. En este
segundo ejemplo se observa al teorema del límite central en un entorno
clásico.
Suponga que se tiene un dado no cargado, lánzalo dos veces y observe el
número de puntos. Así, el primer lanzamiento da 3 y el segundo da un 4, lo que
interesa es el total de puntos, es decir, 7. ¿Cuál es la forma de la población del
157
número de puntos? ¿Cuáles son los resultados posibles de este experimento?
¿Cuál es la forma de la distribución de la suma del número de puntos cuando
un solo dado se lanza dos veces?
Solución
En realidad, se trata de una situación de muestreo. La población es una
distribución uniforme, y cada uno de los números enteros de 1 al 6 tiene la
misma probabilidad de ocurrencia. El cuatro y los diagramas siguientes ilustran
los diversos resultados en la población y sus probabilidades correspondientes.
Ahora, si se lanza dos veces el dado, es posible resumir el número total de

puntos que aparecen en la forma siguiente:
158
Por ejemplo, si el primer lanzamiento del dado es 4 y el segundo 6, el total es
10. A continuación, se desea una distribución del número total del resultado de
puntos que aparecen. Con base en el cuadro, existen 36 resultados posibles, y
sólo un resultado en el número total de puntos que aparecen es 2, al igual que
en el caso que el total es 12. Existen tres casos en el que el total es 4, 6
ocasiones en el que el total es 7, y así sucesivamente. Para este momento
usted quizás habrá observado que es posible encontrar el número de
resultados al observar las diagonales de la esquina superior izquierda a la
inferior derecha. El número total de puntos y la probabilidad de cada una de
ellas se resumen en la ilustración y el diagrama siguiente:
Observe el cambio en la forma de la distribución de las sumas con el de la

población. Se comenzó con una población que era uniforme para el número
entero discreto del 1 al 6. Cuando se lanzó el dado dos veces y se observó el
número total de puntos, la distribución cambia en una distribución en forma
triangular. A propósito, se pudo haber utilizado el número promedio de puntos
en los dos lanzamientos y se habría obtenido la misma forma de distribución.
Sin informar los detalles, suponga que se lanza el mismo dado tres veces y se
registra la distribución de la suma del número de puntos. Primer, se sabe que
la suma mínima posible es 3 y la máxima es 18. Cada una de las sumas 10 y
11 tendrán una probabilidad de concurrencia de 0.1250, que es la más
elevada. El diagrama 7-5 muestra la distribución de probabilidad de la suma de
los tres lanzamientos, así como para uno y para dos de ellos. Una vez más,
159
observe los efectos claros del teorema del límite central. Cuando es posible
moverse de uno a dos y luego tres lanzamientos del dado, la forma de la
distribución cambia y se mueve hacia una forma de campana, la distribución de
probabilidad normal: un resultado interesante que intrigo a los matemáticos del
siglo XVll y que ha tenido como resultado muchas aplicaciones modernas.
AUTOEVALUACIÓN 2-3
Retome los dados de SpenceSprockets, Inc. Seleccione 10 muestras aleatorias
de 5 empleados cada una. Use los métodos descritos en este capítulo y la
tabla de números aleatorios (apéndice E) para encontrar a los empleados que
se han de incluir en las muestras. Calcule las medias de cada muestra y trace
las medias de las muestras en un diagrama similar al 7-3.
Diagrama 7-5: Suma de puntos que aparecen en uno, dos y tres lanzamientos
de un dado normal.
Ejercicios
1.- El apéndice E es una tabla de números aleatorios. En él, cada número
entero de 0 a 9 tiene la misma probabilidad de ocurrencia.
a) Trace una gráfica que muestre la distribución de la población. ¿Cuál es
la media de la población?
b) A continuación se encuentran las primeras 10 filas de cinco dígitos de
apéndice E. Suponga que se trata de 10 muestras aleatorias de cinco
valores cada una. Determine las medias de cada muestra y trace las
medias en un diagrama similar al 7-3. Compare la media de la
distribución muestral de las medias de muestras contra la media de
población.
160
2.- Scrapper Elevator Company tiene 20 representantes de venta que venden
el producto en todo el territorio de Estados Unidos y de Canadá. El número de
unidades que el último mes vendió cada uno de los representantes aparece a
continuación. Suponga que estas cifras de ventas son valores de la población.
2 3 2 3 3 4 2 4 3 2 2 7 3 4 5 3 3 3 3 5
a) Trace una gráfica de la población.

b) Calcule la media de la población.
c) Seleccione cinco muestras aleatorias de cinco cifras cada una y calcule
la media de cada muestra. Use los métodos arriba descritos y en el
apéndice E para determinar los artículos de cada muestra.
d) Compare las medias de la distribución muestral de las medias de
muestras con la media de la población. ¿Esperaría que fueran
exactamente iguales?
e) Trace un histograma de las medias de las muestras. ¿Observa alguna
diferencia en las formas de las medias de las muestras en comparación
con la población?
4.4 TIPOS DE ESTIMACIÓN Y CARACTERÍSTICAS.
Estimadores puntuales e intervalos de confianza

Los datos sobre la antigüedad de servicio de los empleados de SpenceSprockets
que se presentaron en el ejemplo anterior, son una población por que se informa
que de la antigüedad de servicio para los 40 empleados de la empresa. En este
caso es fácil calcular la media de la población. Se tienen todos los datos y la
población no es demasiado grande. Sin embargo, la mayoría de los casos si es
necesario estimarla media de la población. Por lo general no se conoce este
parámetro de la población. Se llama estimador puntual al número único que se
usa para estimar el parámetro de la población.
Estimador puntual. Valor que se calcula a partir da la información de la muestra,
y que se usa para estimar el parámetro de la población.
La media de la muestra, es un estimador puntual de la media de la población, µ,
p es un estimador puntual de π y s es un estimador puntual de σ. Suponga que
Best Buy, Inc, desea estimar la edad media de los compradores de equipos de
161
estéreo. Seleccionan una muestra aleatoria de 50 compradores recientes,
determinan la edad de cada uno de ellos en la muestra, y calculan la edad media
de los compradores en la muestra. La media de las muestras es un estimador
puntual de la media de la población.
No obstante, un estimador puntual solo refiere una parte de la historia. Si bien se
espera que el estimador puntual esté próximo al parámetro de la población, se
desearía expresar qué tan cerca está. Un intervalo de confianza sirve a este
propósito.
4.5 DETERMINACION DEL TAMAÑO DE LA MUESTRA DE UNA POBLACION
Una muestra poblacional es un conjunto de elementos que representan al universo

total, es decir, son una fracción de la totalidad del número de individuos a ser
evaluados. Establecer el tamaño de dicha muestra es un proceso importante en
toda investigación ya que permitirá realizar un estudio viable y creíble siempre
delimitado por los objetivos del estudio y las diferentes características de cada
población
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas,
pueden incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el
equipo que estará en campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
1. Tamaño de la población. Una población es una colección bien definida de

objetos o individuos que tienen características similares. Hablamos de dos tipos:
población objetivo, que suele tiene diversas características y también es conocida
como la población teórica. La población accesible es la población sobre la que los
investigadores aplicaran sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una
estadística que expresa la cantidad de error de muestreo aleatorio en los
resultados de una encuesta, es decir, es la medida estadística del número de
veces de cada 100 que se espera que los resultados se encuentren dentro de un
rango específico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un
valor con una determinada probabilidad alta. Por ejemplo, un intervalo de
confianza de 95% significa que los resultados de una acción probablemente
cubrirán las expectativas el 95% de las veces.
4. La desviación estándar. Es un índice numérico de la dispersión de un
conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor
es la dispersión de la población.
162
Cálculo del tamaño de la muestra desconociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de

la población es la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
Cálculo del tamaño de la muestra conociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la
población es la siguiente:
En donde,
N = tamaño de la población
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).
163
4.6 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA
DISTRIBUCIÓN
Intervalo de confianza para la media de una distribución Normal
Dada una variable aleatoria con distribución Normal N(μ σ, el objetivo es la

construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.
Desde el punto de vista didáctico hemos de considerar dos posibilidades sobre la

desviación típica de la variable: que sea conocida o que sea desconocida y
tengamos que estimarla a partir de la muestra. El caso de σ conocida, ya
comentado anteriormente, no pasa de ser un caso académico con poca aplicación
en la práctica, sin embargo es útil desde el punto de vista didáctico.
Caso de varianza conocida
Dada una muestra X1, ..., Xn, el estadístico
se distribuye según una Normal estándar. Por tanto, aplicando el método del
pivote podemos construir la expresión
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha

una probabilidad deα/2 de la que se deduce el intervalo de confianza
Caso de varianza desconocida
Dada una muestra X1, ..., Xn, el estadístico
164
se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y
siguiendo pasos similares a los del apartado anterior, el intervalo de confianza
resultante es
donde tα/2 es el valor de una distribución t de Student con n − 1 grados de libertad

que deja a su derecha una probabilidad deα/2
165
BIBLIOGRAFÍA
1. Berenson, M. (2006). Estadistica para administración. (4°. Ed.) México: Pearson
Educación.
2. Carot, V. (2006). Control estadístico de la calidad. España: Alfaomega.
3. Devore, J. L. (2012). Probabilidad y estadística para ingenierias y ciencia. (8°. Ed.)
México: Cengage Learning.
4. Gamiz, B. E. (2012). Probabilidad y estadística con prácticas en Excel. (3°. Ed.).
México: JIT Press.
5. Gutiérrez, P. H. (2012). Análisis y diseño de experimentos. (3°. Ed.). México: McGraw-
Hill
6. Gutiérrez, P. H. (2009). Control estadístico de calidad y seis sigma. (2°. Ed.). México:
McGraw-Hill
7. Hines, W. (2009). Probabilidad y estadística para ingeniería. (4°. Ed.) México: CECSA:
Grupo Editorial Patria
8. Johnson, R. A. (2012), probabilidad y estadística para ingenieros. (8°. Ed.). México:
Pearson Educación
9. Kazier, L. (2006). Estadística aplicada a administración y economía. (4°. Ed.). México:
McGraw-Hill
10. Larson, H.J. (1992). Introducción a la teoría de probabilidad e inferencia estadística.
México: Limusa
11. Levine, D. M. (2010). Estadística para administración y economía. (7°. Ed.). México:
Pearson Educación
12. Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13°. Ed.).
México: Cengage Learning
13. Montogomery, D. C. (2011). Probabilidad y Estadística aplicados a la Ingeniería. (2°.
Ed.). México: Limusa: Wiley
14. Quezada, L. (2010). Estadística para ingenieros. México: Empresa Editora Macro
15. Remes O. Antonio J. (2012). Estadística inferencial I y II. (3°. Ed.). talleres I.T.V.
16. Rodríguez, F. J. (2008). Estadística para administración. México: Grupo Editorial
Patria
17. Spiegel, M. (2010). Fórmulas y tablas de matemáticas aplicada. (3°. Ed.). México:
McGraw-Hill
18. Spiegel, M. (2010). Teoría y problemas de Probabilidad y Estadística. (3°. Ed.).
México: McGraw-Hill
19. Wackerly, D. D. (2010). Estadística matemática con aplicaciones. (7°. Ed.). México:
Cengage Learning
20. Walpole, R. E. (2012). Probabilidad y estadística para ingeniería y ciencias. (9°. Ed.).
México: Pearson Educación
166

Libro Estadistica (Para Sabático 2018 Version Docente)

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Libro Estadistica (Para Sabático 2018 Version Docente)

Cargado por

Copyright:

Formatos disponibles

TECNOLÓGICO

INSTITUTO TECNOLÓGICO DE VERACRUZ

COAUTORES: Eduargod, El Chiloso, Nani, Lupita, Karen, Aldo, Chema, La

VERACRUZ, VER. INVIERNO

Manuel Eduardo Cruz Alarcón

“Dedico este libro a Dios, porque tu presencia siempre ha sido el fundamento de

“Lo dedico a mi familia, mis amigos, a The Arctic Monkeys, al “ferras”, a la

"Dedicado a mis padres y a mis tiburones rojos"

Hector "Chema" Flores

“Este texto va dedicado a mi padre, madre, a dios, a toño y a todos los

“Dedico a mis padres, abuelos y compañeros”

La estadística es la ciencia que trata de la recolección, organización, presentación,

*Los datos del Censo de población de un año determinado.

Es la técnica o metodología mediante la cual es posible realizar la estimación de

MUESTRA. Se denomina muestra a una porción de datos representativos de

Variables discretas y variables continuas

*El número de quejas de los clientes o el número de fallas o defectos. *Las

Métodos de muestreo aleatorio

Un muestreo aleatorio es aquel en el que cada uno de los elementos de la

Este tipo de muestreo consiste en elaborar una lista de la población

En esta técnica, la población se divide en clases o estratos de acuerdo a una o

Consiste en definir subgrupos de elementos homogéneos en forma natural y/o

Al recoger datos relativos a las características de un grupo de individuos u objetos,

1.3 DISTRIBUCIÓN DE FRECUENCIAS

Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma

Polígonos de frecuencia para datos agrupados

Polígono de frecuencias acumuladas

Cuanto más grande sea el peso de un elemento, más importante se considera

Cálculo de la mediana para datos agrupados

Relación entre la media, mediana y moda

La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el

Si la variable de interés es de tipo continuo será necesario determinar, para cada

Si la variable es de tipo discreto la mediana será el valor de la variable que

Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia

Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi)

1.5 MEDIDAS DE DISPERSIÓN PARA UN CONJUNTO DE DATOS

¿Qué son los rangos modificados?

¿Qué es la desviación media?

Para los datos de ventas de aparatos electrónicos 8,11,5,14,8,11,16,11, la

Hoja de trabajo para calcular la desviación media de los datos de venta

Así puede decirse que en promedio, las ventas

Para Datos No Agrupados

Se calcula la desviación media.

Para Datos Agrupados en Tablas de Frecuencia

Para Datos Agrupados en Intervalos

Donde xm es la marca de clase.

Calculando la media aritmética se obtiene:

La varianza es la media aritmética de los cuadrados de las desviaciones respecto

b) Se calcula la media aritmética.

d) Se calcula la desviación estándar.

1.5.4 DESVIACIÓN ETÁNDAR

Para la calcular la desviación estándar se sigue los siguientes pasos:

b) Se aplica la respectiva fórmula para calcular la varianza

2.1.1DEFINICION, PROPIEDADES Y OPERACIONES BASICAS CON

Un conjunto es una colección bien definida de objetos, animales o seres en

CONJUNTO NUMERO DE SUBCONJUNTO NUMERO DE

Tabla 5.1 Número de subconjuntos.

12 = 12X11X10X9= 11880= 495 maneras

Existen 495 maneras (subconjuntos) de efectuar el regalo.

Operaciones con conjuntos. -

Figura 5.2 Conjunto universo con dos regiones

Características de las regiones:

Figura 5.3 Conjunto universo con cuatro regiones

El número de quejas de los clientes o el número de fallas o defectos. Las