Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NACIONAL DE MÉXICO
LIBRO DE CONSULTA:
ESTADÍSTICA AVANZADA PARA
INGENIEROS INDUSTRIALES Y
ADMINISTRADORES DE
TECNOLOGICOS
Toño Remes
“Quiero dedicar este libro a mi familia, que me ha enseñado el trabajar duro para
alcanzar mis metas y sueños, a mi hermana y mi pequeño sobrino, a Dios, a mis
amigos que siempre están ahí, a mis dos mejores amigos J. G y R. R. y a los
maestros que sin duda han contribuido de forma importante en mi desarrollo
humano.”
“Este libro va dedicado a mi madre, mi hermano, mi amigo Javier que está allá
arriba junto a mi bisabuela y a todas las personas que dijeron que no iba a triunfar
y al mejor equipo de México, el Cruz-Azul.”
Jorge Toledo
“Mis dedicaciones van dirigidas a mis padres, que son parte fundamental en
formación académica, y a mi hermana, que es quien escucha mis problemas.”
Josmar Malpica
“Este libro lo dedico a mis padres y amigos y a los alumnos que no durmieron para
hacerlo.”
Fernanda Velázquez
“Dedicado a todas las personas que siempre han estado conmigo sin importar
nada, a mi mamá, mi papá, mis hermanos y mi familia, en especial a BRM por ser
mi compañero de vida, por enseñarme lo que es ser mejor, salir a delante y ser
feliz.”
Naomi Nava
2
“Dedico este libro a mi mamá, mi abuelita y mi tío Arturo, que son las personas
que más me apoyan día a día.”
Paola Ortega
“Dedico este libro a todos los que me han brindado apoyo y también a los que no,
porque me han hecho más fuerte.”
Flor Sánchez
“Este libro va dedicado a mis padres que siempre me apoyan, a mis compañeros
que trabajamos juntos durante todo el semestre, y por su puesto a mi profesor que
nos brindo toda su paciencia y conocimiento.”
Karen Fonseca.
“Dedico este trabajo a mis padres, mis hermanas, mis amigos y todos los que me
apoyaron este duro semestre.”
Jennifer Rosales
“Dedico este trabajo a toda mi familia y amigos que siempre me apoyaron en todo
momento ya que con su ayuda pude realizar lo logrado.”
Aldo Patlani
“Este libro o dedico a mi Dios, a mis padres, hermanos y amigos por su apoyo
incondicional a mi vida.”
Lucero Malpica
Itzel Moreno
3
“Dedicado a Dios, a mi familia, a mis amigos y a mis profesores que han sido
parte importante en mi trayectoria académica y de mi vida.”
Lupita Rendón
Maickol Portilla
Erick Saldivar
“Dedico este libro a toda mi familia que siempre me han guiado por el camino
correcto, a mi hermosa novia Lupita Rivas que siempre me ha apoyado y me
motiva a seguir adelante y me enseña algo nuevo cada día, a mis verdaderos
amigos que a pesar de que no siempre los veo, sé que puedo contar con ellos en
cualquier momento, y a todas aquellas personas que han creído en mí.”
Gustavo Covarrubias
Nayeli Nara
4
ÍNDICE
1. DISTRIBUCIONES DE FRECUENCIA..................................................................8
1.1 CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN.............................8
1.2 RECOPILACIÓN DE DATOS........................................................................12
1.3 DISTRIBUCIÓN DE FRECUENCIAS............................................................13
1.3.1 POLÍGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS..............16
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS........20
1.5 MEDIDAS DE DISPERSIÓN PARA UN CONJUNTO DE DATOS
AGRUPADOS Y DATOS NO AGRUPADOS.......................................................27
1.5.1 Rango......................................................................................................27
1.5.2 DESVIACIÓN MEDIA (DM).....................................................................27
1.5.3 LA VARIANZA.........................................................................................31
1.5.4 DESVIACIÓN ETÁNDAR........................................................................35
2. INTRODUCCIÓN A LA PROBABILIDAD Y VALOR ESPERADO......................38
2.1 TEORÍA DE CONJUNTOS............................................................................38
2.1.1DEFINICION, PROPIEDADES Y OPERACIONES BASICAS CON
CONJUNTOS...................................................................................................38
2.1.2 TECNICAS DE CONTEO........................................................................49
2.1.3 DIAGRAMA DE ARBOL..........................................................................54
2.2 COMBINACIONES Y PERMUTACIONES....................................................56
2.3 INTRODUCCION A LA PROBABILIDAD......................................................59
2.3.1 DEFINICION Y EXPRESION..................................................................61
2.4 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES..........63
2.5 EVENTOS INDEPENDIENTES, DEPENDIENTES Y PROBABILIDAD
CONDICIONAL....................................................................................................66
2.6 TEOREMA DE BAYES..................................................................................69
2.7 VALOR ESPERADO O ESPERANZA MATEMATICA..................................70
3. TIPOS DE DISTRIBUCIONES, VARIABLES ALEATORIAS DISCRETAS Y
CONTINUAS............................................................................................................74
3.1 BINOMIAL......................................................................................................74
3.1.1 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR.....74
5
3.1.2 GRAFICA.................................................................................................79
3.2 LA DISTRIBUCIÓN DE POISSON................................................................82
3.3 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTANDAR............84
3.4 GRÁFICA.......................................................................................................87
3.5 HIPERGEOMÉTRICA....................................................................................94
3.6 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR............96
3.7 GRÁFICA.......................................................................................................97
3.8 NORMAL Y LOGARÍTMICO-NORMAL.......................................................100
3.9 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR..........110
3.10 GRÁFICA...................................................................................................118
3.11 APROXIMACIÓN DE LA NORMAL A LA BINOMIAL................................124
3.12 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR........125
3.13 GRÁFICA...................................................................................................127
4.- MUESTREO.....................................................................................................129
4.1 DEFINICIÓN DE MUESTREO.....................................................................129
4.1.1 TIPOS DE MUESTREO ALEATORIO, SISTEMATIZADO,
ESTRATIFICADO Y CONGLOMERADO.......................................................129
4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA............137
4.2.1 DISTRIBUCION MUESTRAL DE LA MEDIA CON VARIANZA
DESCONOCIDA Y CONOCIDA.....................................................................142
4.2.2 DISTRIBUCION MUESTRAL DE LA DIFERENCIA ENTRE DOS
MEDIAS CON VARIANZA DESCONOCIDA Y CONOCIDA..........................144
4.2.3 DISTRIBUCION MUESTRAL DE LA PROPORCION...........................147
4.2.4 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS
PROPORCIONES..........................................................................................148
4.3 TEOREMA DEL LIMITE CENTRAL.............................................................150
4.4 TIPOS DE ESTIMACIÓN Y CARACTERÍSTICAS......................................159
4.5 DETERMINACION DEL TAMAÑO DE LA MUESTRA DE UNA POBLACION
............................................................................................................................160
4.6 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA
DISTRIBUCIÓN.................................................................................................162
BIBLIOGRAFÍA......................................................................................................164
6
¿Sabías que…
Se le llama
distribución de
frecuencias a la
agrupación de
datos en
categorías
mutuamente
excluyentes que
indican el número
de observaciones
en cada categoría.
UNIDAD 1
DISTRIBUCIÓN DE
FRECUENCIA
7
1. DISTRIBUCIONES DE FRECUENCIA
1.1 CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN
Estadística de negocios
Otorga las herramientas necesarias para reunir, analizar, presentar e interpretar
datos, en el campo de los negocios y la economía, proporcionando a quienes
toman decisiones una mejor comprensión del entorno comercial y económico, de
tal manera de ser más eficientes en su tarea.
Destinatarios: Empresarios, gerentes o funcionarios de empresas, tanto privadas
como estatales, ejecutivos de las aéreas de ventas y financieras y además
persona, que participen en actividades donde requieren tratamiento de la
información, como: control de calidad, encuesta de satisfacción y estudios de
mercado.
Estadística descriptiva
Es el proceso que se relaciona con los métodos y/o técnicas para la recopilación,
organización y análisis de un conjunto de datos cuantitativos, con el objeto de
describir en forma apropiada las diversas características de dicho conjunto
Inferencia estadística
*Una encuesta desarrollada por una empresa en marzo del 2010, dice que el
rating de radio en México está encabezado por radio fórmula con un 10,5%
seguido de la fiera con 9,18%.
8
POBLACIÓN. Es la totalidad de elementos de un grupo dado que posee una
característica delimitada para el alcance de una investigación.
Las variables discretas son variables numéricas que tienen un número contable de
valores entre dos valores cualesquiera. Una variable discreta siempre es
numérica.
Variables continuas
Las variables continuas son variables numéricas que tienen un número infinito de
valores entre dos valores cualesquiera. Una variable continua puede ser numérica
o de fecha/hora. *La longitud
de una pieza o la fecha y hora en que se recibe un pago. *El tiempo
transcurrido antes de que falle un dispositivo y el número promedio de personas
por hogar en una comunidad grande.
Simple
9
Sistemático
En este tipo de muestro, también se elabora una lista con los elementos de la
población, pero en lugar de seleccionarlos de manera aleatoria, se recorre la lista
y se va seleccionando cada elemento con un intervalo uniforme que se mide en
tiempo, orden y espacio. Es más sencillo de aplicar que el simple, sin embargo, no
es posible de utilizar con poblaciones grandes o con la posibilidad de que la
población tenga datos con periodicidad.
Estratificado
10
Conglomerados
11
1.2 RECOPILACIÓN DE DATOS
Población
Agregado de unidades elementales, que poseen alguna característica o
propiedades comunes.
El estudio de toda la población constituye un CENSO.
Una población puede ser finita o infinita.
En relación al tamaño de la población, ésta puede ser:
Finita, como es el caso del número de personas que llegan al servicio de
urgencia de un hospital en un día; y se conoce el tamaño N de la
población.
Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y cruces obtenida en el lanzamiento repetido de una
moneda al aire.
Muestra
Es una parte de la población. Se espera que la muestra sea representativa de la
población, es decir reproduzca las características más importantes. El proceso de
obtener la muestra de denomina MUESTREO.
Muestra aleatoria
12
Cuando la muestra ha sido obtenida empleando algún procedimiento del azar:
sorteo, extracción al azar, números aleatorios, etc.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
13
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos
los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el número total de datos. Se puede expresar en tantos por
ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30,
30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a
mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.
x Rec f F ni N 3 8 2 0. 0.
i uen i i i 1 4 2 7
to 5 7
2 I 1 1 0. 0. 8 4
7 0 0 3 III 3 2 0. 0.
3 3 2 7 0 8
2 2 9 7
2 II 2 3 0. 0. 7 1
8 0 0 3 III 3 3 0. 0.
6 9 3 0 0 9
5 7 9 6
2 6 9 0. 0. 7 8
9 1 2 3 I 1 3 0. 1
9 9 4 1 0
4 0 3
3 7 1 0. 0. 2
0 6 2 5 3 1
2 1 1
6 6
14
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de
la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48,
15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y
48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que
sea divisible por el número de intervalos de queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50: 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.
15
ci f F ni Ni 5 . 5 2
i i , 5 0 5
3
[ 2 1 1 0. 0. 0
0 . 0 0 )
, 5 2 2 [ 3 7 2 0. 0.
5 5 5 3 2 4 1 6
) 0 . 7 0
[ 7 1 2 0. 0. , 5 5 0
5 . 0 0 3
, 5 2 5 5
1 5 0 )
0 [ 3 1 3 0. 0.
) 3 7 0 4 2 8
[ 1 3 5 0. 0. 5 . 5 5
1 2 0 1 , 5 0 0
0 . 7 2 4
, 5 5 5 0
1 )
5 [ 4 4 3 0. 0.
) 4 2 8 1 9
[ 1 3 8 0. 0. 0 . 0 5
1 7 0 2 , 5 0 0
5 . 7 0 4
, 5 5 0 5
2 )
0 [ 4 2 4 0. 1
) 4 7 0 0
[ 2 3 1 0. 0. 5 . 5
2 2 1 0 2 , 5 0
0 . 7 7 5
, 5 5 5 0
2 )
5 4 1
) 0
[ 2 6 1 0. 0.
2 7 7 1 4
1.3.1 POLÍGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS.
16
Un polígono de frecuencias se forma uniendo los extremos de las barras de
un diagrama de barras mediante segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
17
Para construir el polígono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectángulo de un histograma.
Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65
18
Histograma
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran
número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud
del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores.
Ojiva
La representación gráfica de un cuadro de frecuencia acumulada son curvas
llamadas ojivas. En la gráfica de ojiva, el último intervalo no se une con el eje
horizontal.
La ojiva apropiada para información que presente frecuencias mayores que el dato
que se está comparando tendrá una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente
positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se
obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y
de igual manera que éstas, existen las ojivas mayores que y las ojivas menores
que.
19
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son e. media, mediana y moda. Las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable. Dicho en otros
términos las medidas de dispersión pretenden evaluar en qué medida los datos
difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto
permiten describir un conjunto de datos entregando información acerca de su
posición y su dispersión. Al describir grupos de diferentes observaciones, con
frecuencia es conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la distribución de datos
se denomina medida o parámetro de tendencia central o de centralización.
Cuando se hace referencia únicamente a la posición de estos parámetros dentro
de la distribución, independientemente de que esté más o menos centrada, se
habla de estas medidas como medidas de posición. En este caso se incluyen
también los cuartiles entre estas medidas.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.
20
Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, moda,
varianza y desviación estándar deben incluir una leve modificación. A
continuación, se entregan los detalles para cada una de las medidas.
Media, Media ponderada.
La media ponderada es una medida de tendencia central, que es apropiada
cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa
(o peso) respecto de los demás datos. Se obtiene multiplicando cada uno de los
datos por su ponderación (peso) para luego sumarlos, obteniendo así una suma
ponderada; después se divide está entre la suma de los pesos, dando como
resultado la media ponderada a la que corresponden los pesos:
La media ponderada (MP)
Es una medida de centralización. Consiste en otorgar a cada observación del
conjunto de datos (X1,X2,…,XN) unos pesos(p1,p2,…,pN) según la importancia de
cada elemento.
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los
datos, una vez que éstos están ordenados de menor a mayor. Por ejemplo, la
21
mediana del número de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
En caso de un número par de datos, la mediana no correspondería a ningún valor
de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los
siguientes Se toma como mediana
Existen métodos de cálculo más rápidos para datos más numerosos (véase
el artículo principal dedicado a este parámetro). Del mismo modo, para valores
agrupados en intervalos, se halla el "intervalo mediano" y, dentro de éste, se
obtiene un valor concreto por interpolación.
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 6 9 4 4 2
22
Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen
derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par,
obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las
frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde
el vigésimo hasta el vigésimo octavo)
Con lo que Me = (5+6)/2 = 5,5 puntos.
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un
error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el
último número, deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos,
incluso cuando alguno de ellos no está acotado.
No se ve afectada por la dispersión. De hecho, es más representativa que la
media aritmética cuando la población es bastante heterogénea. Suele darse esta
circunstancia cuando se resume la información sobre los salarios de un país o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritmética
haciendo que pierda representatividad respecto al grueso de la población. Sin
embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana
más dinero que él, como que gana menos.
Sus principales inconvenientes son que, en el caso de datos agrupados en
intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se
presta a cálculos algebraicos tan bien como la media aritmética.
Moda
La moda es el dato más repetido de la encuesta, el valor de la variable con
mayor frecuencia absoluta. En cierto sentido la definición matemática corresponde
con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se
recurre a la interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-
6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
23
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces
es multimodal. Por último, si todas las variables tienen la misma frecuencia
diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se
ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia
absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:
Siendo la frecuencia absoluta del intervalo modal y las frecuencias absolutas de
los intervalos anterior y posterior, respectivamente, al intervalo modal.
La calificación en la asignatura de Matemáticas de 39 alumnos de una clase viene
dada por la siguiente tabla (debajo):
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
24
Se hace la suma de los productos de las notas por el peso de cada nota y se
divide por la suma de los pesos.
-
Ejemplo:
Promedio en datos agrupados
La fórmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes
valores de Yi.
Consideremos como ejemplo una distribución de frecuencia de
madres que asisten a un programa de lactancia materna,
clasificadas según el número de partos. Por tratarse de una
variable en escala discreta, las clases o categorías asumen
sólo ciertos valores: 1, 2, 3, 4, 5.
25
Entonces las 42 madres han tenido, en promedio, 2,78 partos.
Donde:
26
Moda en datos agrupados
El rango es la diferencia
entre los valores mayores y
menor del conjunto de
datos My representa el dato
mayor y Mn representa el
dato menor
Ejemplo:
Durante un mes determinado del verano de ocho vendedores de
aparatos electrónicos de una empresa vendieron el siguiente número
de ventiladores: 8, 11, 5, 14, 8, 11,16
R= MY-Mn=16-5=11.0 unidades
27
1.5.1 RANGO
Ejemplo:
28
Ejemplo
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
Ejemplo:
Calcular la desviación media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Cal Ca
ific nti
aci da
ón d
de
asi 29
gn
atu
ras
30
Solución:
Se calcula la media aritmética.
Solución:
Para calcular la media aritmética se llena la siguiente tabla:
31
Interval f x f·x
o m m
2-4 6 3 18
4-6 8 5 40
6-8 1 7 112
6
8-10 1 9 90
0
Total 4 260
0
1.5.3 LA VARIANZA
32
Para Datos Agrupados en Intervalos
La varianza para una población se calcula con:
Ejemplo:
Calcular la desviación estándar de los siguientes datos correspondientes a una
muestra.
Intervalo F
60-65 5
65-70 20
70-75 40
80-85 27
85-90 8
Total 100
Solución:
a) Se llena la siguiente tabla:
33
Intervalo f xm f·xm
60-65 5 62,5 312,5
65-70 20 67,5 1350
70-75 40 72,5 2900
80-85 27 82,5 2227,5
85-90 8 87,5 700
Total 100 7490
34
Para Datos No Agrupados
La varianza para una población se calcula con:
35
c) Se calcula la desviación estándar.
36
¿Sabías que…
La probabilidad
es una medida
de la certidumbre
asociada a un
suceso o evento
futuro y suele
expresarse como
un número entre
0 y 1 (o entre
UNIDAD 2 0 % y 100 %).
INTRODUCCIÓN A
LA PROBABILIDAD Y
VALOR ESPERADO
37
2. INTRODUCCIÓN A LA PROBABILIDAD Y VALOR
ESPERADO
2.1 TEORÍA DE CONJUNTOS
38
nombres de las ciudades. Por eso la característica principal de un conjunto es que
esté bien definido.
En matemáticas existen dos maneras de enunciar un conjunto: por
ENUMERACION o TABULAR y por DESCRIPCION o COMPRENSION.
El conjunto se define por enumeración si se da la lista de los elementos que lo
forman.
Ejemplo 5.4:
Represente por enumeración el conjunto de letras que forman la palabra
ESTADISTICA
SOLUCION L= {e, s, t, a, d, i, c}
Aunque hay dos “s”, dos “t”, dos “a” y dos “i” en la palabra estadística nótese que
solamente se representó una sola vez.
CONJUNTO VACIO. - Es un conjunto que carece de elementos. Este conjunto se
suele llamar conjunto nulo. Aquí diremos de un conjunto semejante que es vacío y
se le denotará por el símbolo Ø.
Ejemplo 5.5:
Represente por enumeración el conjunto de personas vivientes mayores de 2000
años.
SOLUCION P= { }
Dentro de la llave no existe elemento alguno ya que no hay alguno que cuente con
las características señaladas; más no por eso se vaya a pensar que no es
conjunto.
El conjunto se describe en forma de comprensión cuando se enuncian la o las
características que sólo esos elementos tienen.
Ejemplo 5.6:
Represente por descripción el conjunto de números impares que estén entre el 8 y
26
SOLUCION A= {x/x es un número impar> 8 pero < que 26}
Se lee: A es el conjunto de elementos, tales son números impares mayores de 8
pero menores de 26, o A es el conjunto de Xs, tal que las Xs toman valores de
números impares mayores de 8, pero menores de 26.
En ocasiones se pide que un conjunto expresado por enumeración sea expresado
por descripción.
Ejemplo 5.7:
Sea el conjunto
39
A= {Estados Unidos, Guatemala, Belice}
a) Definirlo por descripción
SOLUCION ERRONEA A= {x/x es un país de América}
La descripción es equivocada ya que las características señaladas las poseen
también otros países. Debe describirse otra característica que sólo Estados
Unidos, Guatemala y Belice posean y ninguno más.
SOLUCION CORRECTA A= {x/x es un país fronterizo de México}
SUBCONUNTO. - Sean dos conjuntos A y B
Ejemplo 5.8:
A= {a, e, i, o, u} B = {a, e, i}
Obsérvese que todos los elementos de B también los tiene A. Cuando todos los
elementos de un conjunto los tiene otro conjunto, se dice que el primero es
SUBCONJUNTO del segundo. En el ejemplo 5.8, B es subconjunto de A. La
expresión anterior se representa de la siguiente forma: B ﮞA
Ejemplo 5.9:
Sean los conjuntos:
D= {a, c, e, r, o} E= {c, a, m, p, e, o, n}
Obsérvese que los elementos de D: a, c, e, r, o los contiene E pero no el elemento
“r”. Por lo tanto, D no es subconjunto de E, esto se simboliza como DȼE.
Como se ve, basta con que un elemento no pertenezca a otro para que no se
establezca la relación de SUBCONJUNTO.
Una de las operaciones más útiles en estadística es la que consiste en formar
conjuntos derivados de un conjunto mayor dado; esto es formar
SUBCONJUNTOS.
Ejemplo 5.10:
Formar todos los subconjuntos que se pueda con los elementos del conjunto A
A= {g, a, s}
SOLUCION {g}; {a}; {s}; {g, a}; {g, s}; {a, s}; {g, a, s}; Ø.
En total son 8 subconjuntos que pueden formarse. Quizá se crea que faltan más,
ya que se puede formar un subconjunto como el siguiente {g, a} y {a, g}; pero hay
que recordar que el orden de los elementos de un conjunto carece de importancia,
por lo tanto, los dos subconjuntos anteriores son el mismo. Otra duda podría ser si
el conjunto vacío es subconjunto de A, si ni siquiera tiene elementos. Vamos a
demostrarlo: Quedó establecido que, si todos los elementos de un conjunto los
40
contiene otro conjunto, el primero es subconjunto del segundo. Además, si el
primer conjunto tiene algún elemento que el otro no tiene, entonces el primero no
es subconjunto del segundo.
Tratemos de demostrar que el conjunto vacío no es subconjunto del conjunto A.
Para lograrlo, tendremos que encontrar algún elemento que esté en el conjunto
vacío Ø, pero que no esté en A. Si hallamos algún elemento que esté en Ø y que
no esté en A, entonces ØȼA. Como por definición Ø carece de elementos;
entonces Ø no contiene ningún elemento que no contenga A. Concluimos que Ø
es subconjunto de A.
En general, el conjunto vacío es subconjunto de cualquier conjunto de sí mismo.
Es muy importante saber de antemano cuántos subconjuntos se pueden formar
con los elementos de un conjunto, para que no tengamos duda si nos hace falta
alguna. A continuación, deduciremos la fórmula que establece el total de
subconjuntos que se pueden formar con los elementos de un conjunto dado a
partir de la tabla 5.1
En la tabla 5.1 notamos que hay una relación entre el número de elementos que
tiene el conjunto y el exponente que tiene la base 2 es el mismo. Así que, si un
conjunto x tiene cuatro elementos sabremos de antemano que se pueden formar
2^4 subconjuntos, es decir 2x2x2x2= 16
P= 2^n n= número de elementos (5.1)
Fórmula 5.1 Establece el total de subconjuntos que se pueden formar con los
elementos de un conjunto o sea el CONJUNTO POTENCIA.
En la práctica lo importante es conocer cuántos subconjuntos de un conjunto con
cierto número de elementos se pueden formar.
Ejemplo 5.11: Si un conjunto tiene 7 elementos, ¿Cuántos subconjuntos que
tengan sólo 3 elementos de los 7 se pueden formar?
SOLUCION
41
Enumerándolos sería demasiado tedioso. Para encontrar el número de
subconjuntos que se pueden formar con las condiciones señaladas se aplica la
siguiente fórmula.
(5.2)
Para entender la fórmula anterior, substituiremos las letras por los números
mencionados en el problema.
7 El 3 nos dice que en el numerador y en el denominador debe haber tres
factores;
3 en el numerador el primer factor es 3. Los factores que le siguen se disminuyen
en la unidad.
7 = 7x6x5= 35 subconjuntos
3 3x2x1
Existen 35 subconjuntos de 3 elementos, que se pueden formar con los elementos
del conjunto dado.
Ejemplo 5.12:
Se tienen 12 objetos de los cuales se desean regalar 4. ¿De cuantas maneras se
puede escoger?
SOLUCION
42
conjunto UNIVERSO (U), se representa por medio de un rectángulo. Los conjuntos
(C) cuyos elementos se toman del universo, se representan por círculos u óvalos,
dibujados dentro del rectángulo, figura 5.1 Figura 5.1 Diagrama
de Venn
Figura 5.2 Si dentro de un universo hay un conjunto, existirán dos regiones. Cada
región es excluyente de las demás.
43
En R1 y R2 se encuentran los elementos que son de A
En R2 y R3 están los elementos que pertenecen a B
En R1 y R4 están los elementos que no pertenecen a B
En R3 y R4 están los elementos que no pertenecen a A
En R1, R2 y R3 están los elementos que pertenecen a A o a B
Es muy importante que se sepa identificar las características de cada una de las
regiones, para entender las operaciones con conjuntos.
Unión de conjuntos. –
Sean dos conjuntos A y B que se simboliza A U B, representa la unión de A con B
y se forma otro conjunto que tiene todos los elementos de A y los de B.
Ejemplo 5.13:
Encontrar el conjunto de A U B y representarlo en un diagrama de Venn.
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e}
Solución A U B= {s, i, r, e, n, a, o, m, c}
44
A U B gráfica sombreada
Intersección de conjuntos. –
Sean dos conjuntos A y B. La intersección de A y B es el conjunto de elementos
que pertenecen tanto a A como a B. se representa por el símbolo п, la
presentación algebraica de la intersección de los conjuntos del ejemplo 5.13,
numérica y gráficamente.
Solución
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e} AпB= {r, e, n, a}
Ya que sólo estos son los elementos que son comunes a los dos conjuntos, la
representación gráfica sería.
AпB
En forma general tenemos sombreada el área perteneciente a la intersección.
45
AпB
Diferencia entre conjuntos. –
Para explicar esta operación entre conjuntos, emplearemos los conjuntos del
ejemplo 5.13.
La DIFERENCIA del conjunto A menos el conjunto B es el conjunto de elementos
que son de A pero, no de B, o sea, son los elementos que pertenecen únicamente
a A.
Ejemplo 5.15:
Realizar la diferencia A – B
SOLUCION
A= {s, i, r, e, n, a} B= {r, o, m, a, n, c, e} A – B= {s, i}
Los otros elementos de A no se incluyen, ya que pertenecen a A y pertenecen a B
y la diferencia consiste en anotar los elementos que sólo pertenecen a A.
Ejemplo 5.16:
Encontrar la diferencia B – A de los conjuntos del ejemplo 5.13 numérica y
gráficamente.
SOLUCION
B= {r, o, m, a, n, c, e} A= {s, i, r, e, n, a} B –A= {o, m, c}
46
B–A B–A
Observando A U B= (A B) + (A – B) + (B – A); es decir, la intersección y las
diferencias son subconjuntos de la unión.
Complemento. -
Si tenemos un conjunto universo y de él tomamos elementos para formar el
conjunto A, el complemento de A que se simboliza Ac, es el conjunto de los
elementos que no están en A.
Ejemplo 5.17:
Sea el conjunto universo U= {0, 1, 2, 3, 4, 5, 6, 7, 8} y el conjunto A= {2, 3, 5, 7},
formar el conjunto Ac y representarlo con diagramas de Venn.
Solución
Ac= {0, 1, 4, 6, 8}
De lo anterior derivemos los siguientes postulados:
PRIMERO A U Ac= U A unión complemento de A es igual al conjunto universo.
SEGUNDO A п Ac= Ø A intersección con A complemento es igual al conjunto
vacío.
47
Ac Ac
Ejemplo 5.18
Sea U= {g, o, t, a, s, i, n, d, u, c, e}
A= {g, o, t, a, s}
B= {s, a, t, i, n}, encontrar
a) Ac
b) (A U B)c
c) Ac п B
SOLUCION
a) Ac= {i, n, d, u, c, e}
b) (A U B) c= Primero realizaremos la operación señalada dentro del
paréntesis. Esto se hace siempre que existe un paréntesis. Después se
realiza la operación señalada fuera del paréntesis.
(A U B) = {g, o, t, a, s, i, n}
El complemento de (A U B) serán todos los elementos que estén fuera de esta
unión, como son:
(A U B) c = {d, u, c, e}
c) Ac п B antes de realizar la intersección deberemos encontrar el
complemento de A.
Ac= {i, n, d, u, c, e} Son todos los elementos que no están en el conjunto A.
Ac п B= {i, n, d, u, c, e} п {s, a, t, i, n} = {i, n}
Operaciones con conjuntos. –
Las operaciones con conjuntos al igual que en los números, satisfacen ciertas
propiedades o-leyes. Estas leyes se muestran en la tabla 5.2
Leyes de idempotencia
1a. A U A - A lb. A п A = A
Leyes asociativas
2a. AUB)UC = AU(BUC) 2b.(AпB)пc = Aп(BnC)
48
Leyes conmutativas
3a. AUB = BUA 3b. AпB . BпA
Leyes distributivas
4a. Aп(BпC) = (AUB)п(AUc) 4b. Aп(BUC)
= (AпB)u(Aпc)
Leyes de identidad
P-1( -
Leyes de Morgan
k-_
9a. (AUB)c = Ac n Bc- 9b; (AпB)c = AcUBc
49
Ejemplo 6.1:
Efectuar las operaciones con factoriales siguientes:
a) 5!= 1x2x3x4x5= 120
b) 7!= 7x6x5x4x3x2x1
= 7x6x5!
= 7x6x120
=5040
c) 9! = 9x8x7x6! = 9x8x7= 504
6! 6!
d) Cuando realice una multiplicación de dos factoriales, tenga cuidado de no
cometer este error
50
Para ir del punto A al B existen tres caminos, y para ir del punto B al C existen dos
caminos diferentes, como se muestra en la figura 6.1
B
A C
Figura 6.1 caminos entre tres puntos.
SOLUCION
a) Para resolver el ejemplo aplicando el principio fundamental del conteo, se
dividirá el problema en los siguientes actos:
- Primer acto: Escoger el camino para ir de A a B, tres maneras diferentes.
- Segundo acto: Escoger el camino para ir de B a C, dos maneras diferentes.
Luego hay 3x2 = 6 maneras diferentes para ir de A a C pasando por B. De la
figura 6.1 se ve que estas son las formadas por los tramos: t1t4, t1t5, t2t4, t2t5,
t3t5, t3t5.
b) Dividiendo nuevamente el problema en actos, se tiene:
-Primer acto: Escoger el camino para ir de A a C pasando por B, hay seis
maneras diferentes (del inciso anterior)
- Segundo acto: Escoger el camino para ir de C a B, hay dos maneras
diferentes.
Por lo tanto, hay 6x2 = 12 caminos diferentes para ir de A a C pasando por
B y regresando a B.
c) Procediendo en forma idéntica a los incisos anteriores y teniendo en cuenta
ahora que no se puede usar un camino ya recorrido con anterioridad, se
tiene:
-Primer acto: Escoger el camino para ir de A a B, hay tres maneras.
-Segundo acto: Escoger el camino para ir de B a C, hay dos maneras.
-Tercer acto: Escoger el camino para ir de C a B, hay una manera.
-Cuarto acto: Escoger el camino para ir de B a A, hay dos maneras.
Y hay 3x2x1x2 = 12 maneras de hacer un recorrido redondo de A a C y regreso
sin circular más de una vez por un mismo tramo
.
51
Ordenaciones. –
Se llaman ordenaciones “n” objetos de orden r a los diferentes grupos ordenados
que se pueden formar al escoger r objetos de un grupo de “n” objetos dados, de tal
manera que dos ordenaciones se consideran distintas si difieren en alguno de sus
objetos o en el orden de ellos.
Ordenaciones simples sin repetición. -
En la definición anterior se ha considerado implícitamente que el orden r es menor
que el número “n” de objetos dados, lo que equivale a no permitir la repetición de
objetos en una misma ordenación.
Ejemplo 6.3
Formarlas ordenaciones de todas las ordenes de las cuatro letras a, b, c, d
Solución
Ordenaciones de orden 1:
a b c d
Ordenaciones de orden 2:
ab ba ca da
ac bc cb db
ad bd cd dc
Ordenaciones de orden 3:
abc bac cab dab
abd bad cad dac
acb bca cba dba
acd bcd cbd dbc
adb bda cda dca
adc bdc cdb dcb
Ordenaciones de orden 4:
abcd bacd cabd dabc
abdc bacd cadb dacb
acbd bcad cbad dbac
acdb bcda cbda dbca
adbc bdac cdab dcab
adcb bdca cdba dcba
52
Para determinar cuántos grupos ordenados se pueden formar al escoger r objetos
de entre “n” objetos dados, de tal manera que dos de tales grupos se consideren
distintos si difieren en alguno de sus objetos o en el orden de ellos, aplicando el
principio fundamental del conteo se obtiene la fórmula:
Ejemplo 6.4
Calcular el número de arreglos diferentes de tres letras que se pueden formar con
las letras de la palabra OLIVERA, si en los arreglos no se permiten tener letras
repetidas.
Solución
Teniendo en cuenta que la palabra OLIVERA presenta siete letras, de las que se
requiere formar grupos ordenados de tres letras, se tiene:
53
Análogamente a las ordenaciones simples, el principio fundamental del conteo
permite obtener la fórmula para el número de ordenaciones con repetición de “n”
objetos de orden r, teniendo en cuenta que ahora cada uno de los r objetos puede
seleccionarse de “n” maneras distintas. Representando con ORnr al número de las
ordenaciones con repetición de “n” objetos de orden r, se obtiene:
Ejemplo 6.6
Se tienen 20 banderas, de las cuales cinco son blancas, cinco negras, cinco rojas
y cinco azules. Calcular el número de señales diferentes que se pueden formar al
colocar cinco banderas simultáneamente.
Solución
Al tener por lo menos cinco banderas de cada color, se está permitiendo repetir un
color todas las veces necesarias; por lo tanto, se trata de determinar el número de
grupos ordenados que se pueden formar al seleccionar, con repetición, cinco
objetos de un grupo de sólo cuatro. El número de señales es entonces:
Un diagrama de árbol es una herramienta gráfica que se usa para enumerar todas
las posibilidades lógicas de una secuencia de actos o eventos que ocurran de un
número finito de maneras. En la gráfica se representan por medio de rectas las
diferentes acciones que se pueden elegir, llamadas las “ramas del árbol”. Las
ramas parten de puntos que representan instantes de tiempo o lugares en el
espacio, llamados los nodos del árbol, en donde se elige una de las posibles
formas lógicas de actuar. Las ramas llegan a nuevos nodos en donde se vuelve a
decidir sobre nuevas acciones a tomar. La construcción de los diagramas de árbol
se ilustrará en el siguiente ejemplo:
54
Ejemplo 6.13
Construir los diagramas de árbol de cada uno de los incisos del ejemplo 6.2
SOLUCION
55
Hay doce formas diferentes de hacer viajes redondos de A a C sin usar un tramo
más de una vez.
2.2 COMBINACIONES Y PERMUTACIONES
Se llaman combinaciones de “n” objetos de orden “r”, a los diversos grupos que
pueden formarse al elegir “r” objetos de “n” objetos dados, de tal manera que dos
combinaciones se consideren distintas si difieren en uno de sus objetos por lo
menos.
A diferencia de las ordenaciones, en las combinaciones no interesa el orden de los
objetos, sino únicamente la clase de los mismos.
En la definición de combinación también se supuso implícitamente que el orden “r”
no es mayor que el número “n” de objetos dados, de manera de no permitir la
repetición de objetos en una misma combinación.
Ejemplo 6.10
Formar las combinaciones de todas las órdenes de las cuatro letras a, b, c, d
Solución
Combinaciones de orden 1: a b c d
Combinaciones de orden 2: ab bc cd
ac bd
ad
Combinaciones de orden 3: abc bcd
abd
acd
Combinaciones de orden 4: abcd.
La fórmula para obtener el número de combinaciones de “r” elementos tomados de
un conjunto que tiene “n” elementos es:
Ejemplo 6.11
56
De un grupo de diez personas, debe elegirse un comité formado por cinco.
Calcular el número de comités diferentes que se pueden elegir, si:
a) Las diez personas son elegibles libremente.
b) Dos de las personas elegibles no pueden aparecer juntas en el comité.
c) Dos de las personas elegibles deben estar siempre juntas, dentro del
comité o fuera de él.
d) En el comité debe haber un presidente.
SOLUCION
a) Las cinco personas pueden seleccionarse de las diez elegibles de:
Así, hay 252-56= 196 comités en los que no están juntas las dos personas
peleadas.
c) Si las dos personas de la condición están en el comité, los tres restantes se
escogen de:
57
Y la pareja siempre unida.
d) Existen diez maneras de elegir presidente y
Ejemplo 6.12
Formar las combinaciones con repetición hasta de orden tres de las letras a, b, c,
Solución
Combinaciones con repetición de orden 1:
a b c
Combinaciones con repetición de orden 2:
aa bb cc
ab bc
ac
Combinaciones con repetición de orden 3:
aaa bbb ccc
aab bbc
aac bcc
abb
58
abc
acc
Ejemplo 6.13
En una escuela mixta, de hombres y mujeres, se va a formar un comité de cinco
alumnos.
¿Cuántos comités diferentes se pueden formar, con respecto a su composición de
hombres y mujeres?
Solución
Para resolver el ejemplo deberán seleccionarse cinco de los objetos diferentes
(hombre y mujer). Luego el número de comités es:
59
Es toda acción que se realiza con el fin de observar su resultado.
Como ejemplo se puede considerar el problema de determinar la carta de ruptura
a la tensión de una varilla de acero que se prueba con una máquina apropiada. En
este experimento la ACCION consiste en someter a la varilla a una prueba de
ruptura por tensión; después de aplicar cierta carga, la varilla falla por tensión, que
es el resultado de la acción; y la observación, la lectura en la máquina de la carga
que ocasionó la ruptura de la varilla.
Experimentos deterministas y aleatorios. -
Un experimento es determinista si se puede predecir con certeza su resultado
antes de que se presente. Por el contrario, el experimento es aleatorio-si no es
posible. Asegurar el resultado que se va a presentar al realizarlo. El ejemplo de la
prueba de la resistencia de la varilla y el tiro de una moneda corresponden a
experimentos aleatorios, también llamados PROBABILISTICOS. Mientras que si
se suelta un libro en el espacio a fin de determinar si flota en el espacio, se estrella
contra el techo o cae al suelo, corresponde a un experimento determinista.
Evento. –
Es todo resultado posible de un experimento aleatorio, como puede ser el que
caiga águila en el caso del tiro de una moneda o que la resistencia de la varilla
probada sea superior a-4000 Kg/cm2.
Evento elemental. -
Es aquel que contiene un solo elemento (resultado más simple). Por ejemplo, al
tirar un dado y observar el número de la cara que ve hacia arriba, los eventos
elementales serán: Cae 1, 2, 3, 4, 5 y 6.
Evento compuesto. -
O simplemente evento, es aquel que contiene dos o más elementos, o sea que es
cualquier resultado de un experimento aleatorio que pueda expresarse por medio
de varios eventos elementales. Por ejemplo, el evento cae par, del ejemplo
anterior, se expresa mediante los eventos elementales cae 2, cae 4, o cae 6.
Espacio de eventos o espacio muestral. –
Es el conjunto de todos los diferentes resultados posibles de obtener al realizar un
experimento aleatorio.
Un espacio de eventos cuyos elementos asumen valores no continuos (discretos)
se le llama Espacio De Eventos Discreto O Continuo, y tiene como
característica que sus elementos se pueden con tan o enumerar.
Si los resultados posibles varían en forma continua, es decir los elementos del
espacio de eventos no se pueden enumerar o contar, este se llama Espacio De
Eventos Continuo.
60
Podemos combinar eventos para formar nuevos eventos, utilizan do las
operaciones con conjuntos. Supóngase que A y B pertenecen - al mismo espacio
de eventos S.
a) A UB Es el evento que sucede si y sólo si A o B, o ambos suceden
b) A n B Es el evento que sucede si y solo si A y E suceden simultáneamente
c) Ac (complemento de A) es el evento que sucede si y sólo si A no
sucede.
Si dos o más eventos no tienen algún elemento en común o no - pueden ocurrir
simultáneamente se dice que son Mutuamente Exclusivos O Excluyentes.
Sea el caso del lanzamiento de un dado si A0 = {1,2,3} y A1 = {4,5,6}, entonces
A0 y A1 son mutuamente exclusivos ya que A0п A1 = Ø
2.3.1 DEFINICION Y EXPRESION
Ejemplo 7.1
Si se tienen en una urna cinco bolas rojas y quince blancas, y se va a seleccionar
al azar una de ellas, la probabilidad de que sea roja (evento A) es:
P (A)= 5/20= 1/4
61
Ya que A puede ocurrir de cinco n(A) = 5 maneras distintas e igualmente
probables, puesto que la extensión se realiza al azar, además, el total de
posibilidades es n(S) = 20.
b) Las frecuencias relativas son una explicación intuitiva satisfactoria de la
medida de probabilidad asignada a un punto muestral. Este criterio indica
que si un experimento se repite n veces, de los cuales n(A) veces se
observa el evento A, entonces la probabilidad de A es el límite de la
frecuencia relativa, n(A)/n, de ocurrencia de A, es decir:
62
P (c) = P (Cuevas gane)= 0.75
2.4 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES
Axiomas de probabilidad. –
La validez matemática de cualquier resultado derivado a través de la aplicación
correcta de la teoría axiomática de las probabilidades es cierta, sin importar como
interpreta el ingeniero el significado de la medida de probabilidad ni cuál fue su
origen, mientras la asignación de los pesos sea compatible con 3 axiomas
sencillos.
AXIOMA I.- La probabilidad de ocurrencia de un evento es un número, P(A), que
se le asigna a dicho evento, cuyo valor es menor o igual que uno.
0< P (A) < 1
AXIOMA II.- Si “S” es el espacio de eventos asociado a un experimento, entonces:
P (s) = 1
AXIOMA III.- La probabilidad, P (c), de la unión “C”, de dos eventos mutuamente
exclusivos, A y B, es igual a la suma de las probabilidades de estos, es decir.
P (A U B) = P (c) = P (A) + P (B)
De los axiomas anteriores deducimos los siguientes teoremas:
TEOREMA I: Si Ø es el conjunto vacío, entonces P (Ø) = 0
TEOREMA II: Si Ac es el complemento del evento A, entonces
P (Ac) = 1 – P(A)
TEOREMA III.- Si A es un subconjunto del evento B, entonces
P (A) < P (B)
La primera de las hipótesis significa que físicamente es posible construir y contar
cuantos eventos elementales hay en el espacio de eventos del experimento. La
segunda muestra que no hay ninguna preferencia sobre la ocurrencia de alguno o
algunos de los eventos elementales.
Entonces la probabilidad de A es:
Ejemplo 7.4
63
Sea el caso del tiro de un dado con sus caras numeradas del 1 al 6.
a) ¿Cuál es la probabilidad de que ocurra el evento cae un número par?
b) ¿Cuál es la probabilidad de que ocurra el evento cae 8?
c) ¿Cuál es la probabilidad de que ocurra el evento cae un número entre 0 y
7?
Solución
a) Si A es el evento cae par y S el espacio de eventos, o sea,
A= {2, 4, 6} y S= {1, 2, 3, 4, 5, 6}, entonces n(A) = 3 y n(S) = 6
Luego P (A) = 3/6 = ½= 0.5
Esto significa que en el 50 % de las veces caerá un número par al tirar el dado.
b) El evento cae 8 es un evento imposible, luego, si Ø representa dicho
evento, se tiene que n(Ø) = 0, y
SOLUCION
64
Existen C122 =66 maneras en que se pueden escoger dos artículos entre 12 (n=
66)
Existen C.24= 6 maneras en que se pueden escoger dos artículos defectuosos
entre cuatro defectuosos (A = 6)
Existen C28= 28 maneras en que se pueden escoger dos artículos no defectuosos
entre 8 no defectuosos (B = 28)
Ejemplo 7.6
En un examen de probabilidad y estadística, 4 alumnos obtuvieron calificación MB
(Muy bien), 10 B (Bien), 13 S (Suficiente) y 3 NA (No Aprobados). ¿Cuál es la
probabilidad de que un alumno seleccionado al azar para que pase al pizarrón a
resolver el examen después de que ha concluido, haya obtenido una nota de MB o
B?
Sean: M= evento obtener calificación de MB
B= evento obtener calificación de B
Los cuales son mutuamente excluyentes, entonces
P (M o B)= P (M U B)= P (M) + P (B)
65
Figura 7.4 Espacio De Eventos De Las Calificaciones De Un Examen
Solución
Hay cuatro eventos elementales en M y diez en B; el espacio de eventos está
determinado por el total de calificaciones, que son 30. Luego:
P (M U B) = 4/30 + 10/30= 14/30= 0.467
66
Figura 7.5 Probabilidad Condicional
67
O100= evento sale moneda de oro cien pesos.
Solución
Ejemplo 7.8
68
Solución
Teorema De La Multiplicación. -
Generalizando tenemos:
P (B/A) = P (B)
69
P (B/A)= P (B)
Generalizando:
70
Descripción de una variable aleatoria discreta
De la misma manera como ocurre con las colecciones de datos muéstrales y
poblacionales, con frecuencia es útil describir una variable aleatoria en términos
de su media (véase la sección 3.2) y de su varianza o desviación estándar (véase
la sección 4.6). La media (a largo plazo) de una variable aleatoria X se llama valor
esperado y se denota por E(X). En el caso de una variable aleatoria discreta, la
media es el promedio ponderado de todos sus posibles valores numéricos
empleando las probabilidades respectivas como factores de ponderación. Debido
a que la suma de los factores de ponderación (probabilidades) es 1.0, la fórmula
(3.3) se puede simplificar, y el valor esperado en el caso de una variable aleatoria
discreta es
En la tabla 6.2 se presenta el cálculo, de acuerdo con los datos de la tabla 6.1, del
valor esperado de la variable aleatoria. El valor esperado es 5.66 camionetas.
Observe que el valor esperado de una variable discreta puede ser un valor
fraccionario, ya que representa el valor promedio a largo plazo, y no el valor
específico de alguna observación dada.
La varianza de una variable aleatoria X se denota por V(X); esta varianza se
calcula en relación con E(X) como media de la distribución de probabilidad. La
71
forma general, la fórmula de las desviaciones para el cálculo de la varianza de una
variable aleatoria discreta es
72
Igual que en la sección 4.6, tratándose de poblaciones o de muestras, la
desviación estándar de una variable aleatoria es simplemente la raíz cuadrada de
la varianza:
δ= √V(X)
Una ventaja de la desviación estándar es que se expresa en las mismas unidades
que la variable aleatoria y no en unidades al cuadrado.
La desviación estándar de la demanda en el alquiler de las camionetas es:
δ= √V(X)= √1.74= 1.32 camionetas
73
¿Sabías que…
En teoría de la
probabilidad y
estadística, la
distribución de
probabilidad de
una variable
aleatoria es una
función que
VARIABLES
ALEATORIAS,
DISCRETAS Y
CONTINUAS
74
3. TIPOS DE DISTRIBUCIONES, VARIABLES
ALEATORIAS DISCRETAS Y CONTINUAS.
3.1 BINOMIAL
75
H a y t r e s a r re g l o s c o n d o s " c a r a s" e n l o s t r e s l a n z a mi e n t o s d e
u n a m o n e d a , H H T , H T H y THE. Primero se calcula la probabilidad
de HHT. Este evento constituye una secuencia de eventos
independientes: H en el primero, H en el segundo, y T en el tercer
lanzamiento, resp e c ti va me n te . Po r s e p a ra d o se c o n o ce l a s
p ro b a b i l i d a d e s d e ca d a u n o d e e l l o s:
P (H H T ) = ( 0 . 6 ) ( 0 . 6 ) ( 0 . 4 ) = ( 0 . 6 ) 2 ( 0 . 4 ) 1
D e f o r ma si mi l a r, P (I TT FI ) = (0 .6 )( 0 . 4 ) (0 . 6 ) = ( 0 . 6 ) 2 (0 _ 4 ) 1 y
P ( TH H ) = (0 . 4 ) (0 .6 )( 0 . 6 ) = (0 .6 ) 2 (0 .4 ) 1 . Es fá cil ve r qu e to do s l o s
di fe re n te s arre g lo s d e do s "ca ra s" y u na " cru z" ti e ne n la mi sma
p ro b a bi l id a d . Ah o ra
P(X = 2) = P(HFIT o HTH o TIII-I)
= P(HHT) P(HTH) P(THH)
= (0.6) 2 (0.4) 1 +(0.6) 2 (0.4) 1 + (0.6) 2 (0.4
= 3(0.6) 2 (0.4) 1
A l e xa mi n a r e s te re su l ta d o se o b se rv a q u e e l n ú me ro 3
re p re se n ta e l n ú me ro d e a r re g l o s d e . d o s éxi to s (" ca ra " ) y u n
fra ca so (" cru z" ), 0 .6 e s la p ro ba b il i d ad de é xi to p , e l e xpo n e n te 2
e s e l n ú me r o d e é x i t o s , 0 .4 e s l a p ro b a b i l i d a d d e fr a ca so 1 - p y e l
e xp o n e n te 1 e s e l n ú me ro d e fracasos.
Ahora se puede generalizar este resultado para generar una fórmula
de la probabilidad d e x é xi to s en n en sa yo s de Be rn o u ll i
in d ep e n di e n te s co n p rob a b il i da d d e é xi to p , en té rmi n o s de x,n y
p . E n o tra s p a la b ra s, es po si bl e ca l cu l a r P(X=x) do n de
X ~B in (n ,p ). se pu e d e ve r q ue P(X = x) (número de arreglos de x
éxitos en n ensayos) - p x (1 - p)n
ahora todo lo que se necesita hacer es una expresión del número de
arreglos de x éxitos en n ensayos. Para describir este número, se necesita
la notación factorial. Para cualquier positivo a, la cantidad n! (que se lee
como "a factorial") es el número
(n)(n - l)(n - 2)…… (3)(2)(1)
76
Asimismo, se define 0! = 1. El número de arreglos de x éxitos en n ensayos
es n!/x!(n – x)!
(En la sección 2.2 se presentó una deducción de este resultado.) Ahora se
puede definir l a f u n c i ó n d e m a s a d e p r o b a b i l i d a d p a r a u n a
variable aleatoria binomial.
La figura 4.2 muestra los histogramas para las funciones de masa de
probabilidad.
Ejemplo:
Se lanza al aire ocho veces un dado. Determine la probabilidad de que no
salgan más de dos números seis.
Solución
77
Cada lanzamiento del dado es un experimento Bernoulli con una probabilidad
de éxito de 1/6. Sea X el número de seises en los ocho lanzamientos. Entonces
X — Bin(8, 1/6). Se necesita determinar a P(X 2). Con el uso de la función de
masa de probabilidad,
78
multiplicación de la probabilidad de éxito (0.5) por elementos (10). Este
método generalmente funciona. Si se realizara n ensayos de Bernoulli, cada
uno con una probabilidad de éxito p, el número promedio de éxitos es np,
por consiguiente si X — Bin(n, p), entonces µx=np. Se puede comprobar
esta situación cuando se observa que X es la suma de n variables de
Bernoulli, cada una con media p. Por tanto, la una de las medias de
variables aleatorias de Bernoulli que la componen, que Se puede calcular a
σ²× al observar que X es la suma de variables aleatorias independientes de
Bernoulli y recordando que la varianza de una variable aleatoria Bernoulli
p(1 - p) la varianza de X es la suma de las varianzas de las variables
integran, que es igual np(1 — p).
Resumen
lux = nP (4.5)
2 = nP(1 p) (4.6)
Ejemplo:
Un ingeniero que supervisa el control de calidad está probando la calibración de
una máquina que empaca helado en contenedores. En una muestra de 20 de
79
éstos, tres no están del todo llenos. Estime la probabilidad p de que la máquina
no llene bien un contenedor.
Solución
La proporción muestral de contenedores no llenos es P = 3/20 = 0.15. Se estima
que la probabilidad p de que la máquina no llene bien un contenedor es también
igual a 0.15.
Incertidumbre en una proporción muestral
Es importante considerar que la proporción muestral P es sólo una estimación de
la probabilidad de éxito p, y que, en general, no es igual a p. Si se tomara otra
muestra, probablemente el valor de P sería diferente. Es decir, hay incertidumbre
en 73. Para que P sea una estimación útil, se debe calcular su sesgo y su
incertidumbre. Ahora se hace esto. Sea n el tamaño muestral y X el número de
éxitos, donde X — Bin(n, p).
El sesgo es la diferencia µp, — p. En virtud de que p=X/n, se tiene,
a partir de la ecuación (2.41), (de la sección 2.5) que
3.1.2 GRAFICA
80
por ejemplo, si en un examen al término de un seminario ejecutivo consiste de 20
preguntas de opción múltiple, el número de ensayos es 20. Si cada pregunta tiene
cinco opciones y sólo una es la correcta, la probabilidad de éxito para una persona
sin conocimiento del tema en cada ensayo será de 0.20. Por lo tanto, la probabilidad
es 0.20 de que una persona sin conocimiento del tema acierte la respuesta
correcta. Asimismo, se cumplen las condiciones de la distribución de probabilidad
binomial arriba enunciadas. La distribución de probabilidad binomial se representa
con el modelo matemático:
DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL P(x) = ,f)„, nx(1 n)" - x
[5-31
Donde
C denota una combinación
n es el número de ensayos
x es el número de éxitos
p es la probabilidad de éxito de cada ensayo
Ejemplo:
Cada día, Allegheny Airlines tiene cinco vuelos desde Pittsburgh al aeropuerto
regional de Bradford, Pensilvania. Suponga que la probabilidad de que alguno de los
vuelos se retrase es de 0.20. ¿Cuál es la probabilidad de que ninguno de los vuelos
se retrase el día de hoy? ¿Cuál es la probabilidad de que exactamente uno de los
vuelos se retrase este día?
Es posible utilizar la fórmula (5-3). La probabilidad de que un vuelo en particular se
retrase es de 0.20, de modo que sea p = 0.20. Hay cinco vuelos, de modo que rt =
5, y x se refiere al número de éxitos. En este caso, un "éxito" es un avión que llega
tarde. Debido a que no hay llegadas con retraso x = 0.
P(0) = „C),((p)(1 - p)n-x
5 C0(.02)°(1 - (1)(1)(.3277) = 3277
La probabilidad de que hoy llegue tarde exactamente uno de los cinco vuelos es
0.4096, que se encuentra mediante
P(1) = nCx(p)x(1 - x
= 5 C1 (.201 (1 - .20)5-1 (5)(.20)(.4096) = .4096
La distribución de probabilidad completa se muestra en la ilustración 5-2.
81
Número de vuelos con
probabilidad de retraso:
.3277
1 .4096
2 .2048
3 .0512
4 .0064
5 .0003
Total 1.000
x
.05
.1 .2 .3 .4 .5 .6 .7 .8
.9
o .735 .531 .262. .118 .047 .016 .004 .001 .000 .00
1 .232 .354 .393 .303 .187 .094 .037 .010 . .000
82
2 .031 .098 .246 .324 .311 .234 .138 .060 . .001
3 .002 .015 .082 .185 .276 .313 276 .185 . .015
4 .000 .001 .015 .060 .138 234 .311 324 246 .096
5 .000 .000 .002 .010 .037 .094 .187 .303 . .354
6 .000 .000 .000 .001 .004 .016 .047 .118 . .531
Estas probabilidades son casi iguales entre sí. Aunque a partir de la fórmula de
la función de masa de probabilidad binomial esto no es obvio, cuando n es
grande y p es pequeña la función de masa depende por completo de la media
np, y muy pocos de los valores específicos de n y p. Por consiguiente, se puede
aproximar la función de masa binomial con una cantidad que dependa sólo del
producto np. Específicamente, si n es grande y p es pequeña, y X = np, se
puede demostrar mediante métodos avanzados que para todas las x,
83
Esto conduce a la definición de una nueva función de probabilidad,
denominada función de masa de probabilidad de Poisson, que se define
mediante
Para las masas radiactivas descritas al inicio de esta sección, se utiliza la
84
3.3 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTANDAR
Para calcular la media y la varianza de una variable aleatoria de Poisson, se
emplea la función de masa de probabilidad junto con las definiciones dadas por las
ecuaciones (2.29) y (2.30) (de la sección 2.4). Al final de esta sección se muestran
deducciones rigurosas de la media y de la varianza con este método. Aquí se
presenta un enfoque intuitivo. Si X — Poisson(?) se puede considerar a X como una
variable aleatoria binomial con n grande, p pequeña y np = X. Dado que la media
de una variable aleatoria binomial es np, se tiene que la media de una variable
aleatoria de Poisson es X. La varianza de una variable aleatoria binomial es np(1
— p). Puesto que p es muy pequeña, se puede reemplazar 1 — p con 1, y concluir
que la varianza de una variable aleatoria de Poisson es np = 2L.. Observe que esta
última es igual a su media.
85
su concentración en e,1 medio cambia con el tiempo. Por tanto, antes de que se
agregue la levadura, se necesita calcular la concentración de células de levadura
por unidad en el volumen de la suspensión, para asegurarse de que se añadió la
cantidad correcta.
Hasta principios del siglo xx, lo anterior consistía un problema para los fabricantes
de cerveza. Ellos estimaban la concentración al extraer un pequeño volumen de la
suspensión y contar las células de levadura en ésta utilizando un microscopio. Por
supuesto que las estimaciones determinadas así estaban sujetas a la incertidumbre,
pero nadie sabía cómo calcular ésta. Por tanto, nadie sabía en cuánto podía diferir
la concentración de la muestra de la concentración verdadera.
86
una profunda influencia en los trabajos de casi todos los campos de la ciencia.
Ese resultado se analiza en la sección 5.3.
Ejemplo 4.17:
Unas particulas (por ejemplo, células de levadura) están suspendidas en un medio
liquido con concentración de diez particulas por ml. Se agita por completo un volumen
grande de la suspensión y después se extrae 1 ml. ¿ cual es la probabilidad de que
solo se extraigan ocho partículas?
Solución
Siempre y cuando el volumen extraído sea una fracción pequeña del total, la
solución a este problema no depende del volumen total de la suspensión, sino sólo
de la concentración de partículas en éste. Sea V el volumen total de la suspensión,
en mL. Entonces, el número total de partículas en la suspensión es 10V. Considere
a cada una de éstas como un ensayo de Bernoulli. Una partícula tiene "éxito" si es
retirada. Ahora, se extrae 1 mL del total de V mL. Por consecuencia, la cantidad que
se retirará representa 1/V del total, de ahí que cada partícula tenga una
probabilidad de 1/V de ser retirada. Sea X el número de partículas extraídas. De
este modo, X representa el número de éxitos en 10V ensayos de Bernoulli, cada
uno con probabilidad de éxito de 1/V. Por tanto, X -- Bin(10V, 1/V). Puesto que Ves
grande, 10V es grande y 1/V es pequeño. Por consiguiente, en una aproximación
muy cercana, X — Poisson(10). Se calcula P(X = 8) con la función de masa de
probabilidad Poisson: P(X = 8) = e- 10108/8! = 0.1126.
87
3.4 GRÁFICA
Dado que ^λ = X/t, se tiene a partir de la ecuacion (2.43) (de la sección 2.5) que σ ^λ =
σX/t. debido a que X~poisson(ʎt), se tiene a partir de la ecuación (4.11) que σx=
√ ʎ t por consecuencia,
88
rigurosa. Entre los ejemplos está el número de visitas a un sitio web, el número de
accidentes de tráfico en una intersección y el número de árboles en una sección
del bosque.
probabilidad de Poisson(ʎ) sobre todo sus valores posible. Por tanto ∑ x ∞=0 e−ʎ ʎ x
/x! = 1, por lo que, µx = ʎ
Se emplea la ecuación (2.31) (de la sección 2.4) para demostrar que σ²x= ʎ.
89
Al sustituir x(x – 1) + x para x² y ʎ para µx en la ecuación, se obtiene
Ejercicios
90
e) µx
f) σx
a)P(X = 5)
b)P(X 2)
c) P(X > 1)
d)µx
e) σx
3. Suponga que 0.03% de los contenedores plásticos producidos en cierto proceso
tiene pequeños agujeros que los dejan inservibles. X representa el número de
contenedores en una muestra aleatoria de 10 000 que tienen este defecto.
Determine
a) P(X = 3)
b) P(X .5_ 2)
c) P(1 5- X < 4)
d) µx
e) σx
4. Uno de cada 5 000 individuos en una población porta cierto gen defectuoso. Se
estudia una muestra aleatoria de 1 000 individuos.
91
a) ¿Cuál es la probabilidad de que se reciban cinco mensajes en
una hora?
b) ¿Cuál es la probabilidad de que se reciban diez mensajes en 1.5
horas?
c) ¿Cuál es la probabilidad de que se reciban menos de tres mensajes
en 1½ horas?
6. Cierto tipo de tablero de circuitos contiene 300 diodos. cada uno tiene una
probabilidad p = 0.002 de fallar.
7. Una variable aleatoria X tiene una distribución binomial una variable aleatoria Y
tiene una distribución de Poisson Tanto X como Y tienen medias iguales a 3. ¿Es
posible determinar qué variable aleatoria tiene la varianza más grande? Elija
una de las siguientes respuestas:
92
bacterias por mL, en esta agua tratada y determine la incertidumbre en al
estimación
10. la abuela esta probando una nueva receta de pan de pasas. En cada hornada
de la masa de pan salen tres hojazas, y cada una tiene 20 rebanadas de pan
a) Si ella agrega 100 pasas a cada hornada de masa, ¿Cuál es la
probabilidad de que una rebanada de pan elegida aleatoriamente no tenga
pasas?
b) Si ella agrega 200 pasas a una hornada de masas, ¿cual es la
probabilidad de que una rebanada de pan elegida aleatoriamente tenga
cinco pasas?
c) ¿Cuántas pasas debe agregar para que la probabilidad de que una
rebanada elegida de forma aleatoria no tenga pasas sea 0.01?
12. Usted ha recibido una masa radiactiva de la que se afirma tiene una media
de la razón de decaimiento de al menos una partícula por segundo. Si la media
de la razón de decaimiento es menor a una por segundo, usted puede regresar
el producto para un reembolso. Sea X el número de eventos de decaimiento que
se produce en diez segundos.
a) Si la media de la razón de decaimiento es exactamente de una por
segundo (de tal forma que la afirmación es verdad, pero apenas), ¿a qué
es igual P(X 5_ 1)?
93
b) Con base en la respuesta del inciso a), si la razón de decaimiento promedio
es de una partícula por segundo, ¿un evento en diez segundos sería un
número inusualmente pequeño?
c) Si usted encuentra un evento de decaimiento en diez segundos, ¿esto
sería una evidencia de que debe regresarse el producto? Explique.
d) Si la media de la razón de decaimiento es sólo de una por segundo, ¿a
qué es igual P(X 5< 8)?
13. Alguien afirma que cierta suspensión contiene al menos siete partículas por
mL. Extrae una muestra de 1 mL de la solución. Sea X el número de
partículas en la muestra.
a) Si el número promedio de partículas es exactamente siete por mL (de
manera que la afirmación es verdad, pero apenas), ¿a qué es igual
P(X 1)?
b) Con base en la respuesta del inciso (a), si la suspensión contiene
siete partículas por mL, ¿una partícula en una muestra de 1 mL sería
un número inusualmente pequeño?
c) Si encuentra una partícula en la muestra, ¿esto sería una evidencia de
que la afirmación es falsa? Explique.
d) Si la media del número de partículas es exactamente 7 por mL, ¿a
qué es igual P(X 6)?
e) Con base en la respuesta del inciso (d), si la suspensión contiene
siete partículas por mL, ¿seis partículas en una muestra de 1 mL sería
un número inusualmente pequeño?
f) Si cuenta seis partículas en la muestra, ¿esto sería una evidencia de
que la afirmación es falsa? Explique.
94
14. Un físico desea estimar la razón de emisiones de partículas alfa
provenientes de cierta fuente. Él hace dos cuentas. Primero mide la razón
fonda contando el número de partículas que hay durante 100 segundos en
ausencia de la fuente. Cuenta 36 emisiones de fondo: Después, con la fuente
presente, cuenta 324 emisiones en 100 segundos. Esto último representa la
suma de las emisiones de la fuente más las emisiones de fondo.
a)Estime la razón de fondo, en emisiones por segundo, y determine la
incertidumbre en la estimación.
b) Estime la suma de la fuente más la razón de fondo, en emisiones por
segundo, y determine la incertidumbre en la estimación.
c) Estime la razón de emisiones provenientes de la fuente en partículas por
segundo, y determine la incertidumbre en la estimación.
d) ¿Qué da como resultado una menor incertidumbre al estimar la razón de
emisiones provenientes de la fuente: (1) contar las partículas de fondo
sólo durante 150 segundos.
3.5 HIPERGEOMÉTRICA
Cuando una población finita contiene dos tipos de unidades, que pueden ser
denominados como éxitos y fracasos, y se extrae una muestra aleatoria simple de
la población, cada unidad representa un ensayo de Bernoulli. A medida que se
selecciona cada unidad, la proporción de éxitos en la población restante disminuye
o aumenta, dependiendo si la unidad extraída es un éxito o fracaso. Por esta
razón, los ensayos no son independientes, de ahí que el número de éxitos en la
muestra no siga una distribución binomial. En su lugar, la distribución que describe
adecuadamente el número de éxitos en esta situación se llama distribución
hipergeométrica.
Como ejemplo, suponga que se tiene un lote de 20 unidades que contiene seis
que están defectuosos, y que se extrae aleatoriamente cinco unidades de este
lote. Sea X el número de unidades defectuosas en la muestra. Se calculará P (X =
2). Con este propósito, primero se cuenta el número total de los grupos diferentes
de cinco unidades que puede extraerse de la población de 20. (Se hará referencia
a cada grupo de cinco unidades como combinación.) El número de combinaciones
de cinco unidades es el número de muestras diferentes que se puede extraer, y
cada una es igualmente probable. Después se determinará cuántas de estas
combinaciones contienen exactamente dos defectuosas. La probabilidad de que
una combinación de cinco unidades contenga solo dos defectuosas es el cociente.
número de combinaciones de cinco unidades que contienen dos defectuosas
P(X=2) =
n ú mero de combinacionesde cincounidades que pueden seleccionarse de 20
95
En general, el número de combinaciones de k unidades que
se puede elegir de un grupo de n unidades se denota
n
por()
k
.
96
Para calcular P (X = 2) en el ejemplo anterior, fue necesario conocer el número de
unidades en la población (20), el de unidades defectuosas en la población (6) y el
de unidades extraídas (5). La función de masa de probabilidad de la variable
aleatoria X se determina al utilizar estos tres parámetros. Específicamente, X
tiene una distribución hipergeométrica con los parámetros 20, 6 y 5, ello se
denota mediante X — H (20, 6, 5). Ahora se generalizará esta idea.
Suponga una población finita que contiene N unidades, de ellas R son clasificadas
como éxitos y N — R como fracasos. Suponga que se extrae n unidades de esta
población, y sea X el número de éxitos en la muestra. Entonces X sigue la
distribución hipergeomé- trica con los parámetros N,
R y n, que se puede denotar como X — H (N, R,
n). La función de masa de probabilidad de X es:
Ejemplo 4.28
Solución
Sea X el número de edificios seleccionados que violan el código. Entonces, X
-H (50,12,10). Se debe determinar P (X = 3). Utilizando la ecuación (4.15),
97
3.6 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIÓN ESTÁNDAR
En el recuadro siguiente se presenta la media y varianza de la distribución
hipergeométrica. Se omiten sus deducciones.
Ejemplo 4.29
Con referencia al ejemplo 4.28 encuentre la media y la varianza de X:
Solución
X — H (50, 12, 10), por lo que
98
En la práctica, rara vez se extraen muestras con reemplazo, debido a que no es
necesario extraer la misma unidad dos veces. En su lugar, el muestreo se realiza
sin reemplazo, en el cual cada unidad es eliminada de la población después de
que es extraída. Entonces, las unidades de la muestra son resultado de ensayos
de Bernoulli dependientes, ya que la población cambia conforme se extrae cada
unidad. Por esta razón, la distribución del número de éxitos, X, es H (N, R, n) en
vez de Bin (n, R / N).
Cuando el tamaño muestra n es pequeño en comparación con el tamaño de
la población N (es decir, no mayor a 5%), la diferencia entre el muestreo con o sin
reemplazo es poca, y la distribución binomial Bin (n, R / N) es una buena
aproximación de la distribución hipergeométrica H (N, R, n). Observe que la media
de H (N, R, n) es n R / N, la misma que la de Bin (n, RIN). Esto último indica que
sea que realice la muestra con o sin reemplazo, la proporción de éxitos de la
muestra en promedio es la misma que la de éxitos de la población. La varianza de
Bin (n, R / N) es n (R / N) (1 — R / N) y la varianza de H (N, R, n) se obtiene al
multiplicar esto por el factor (N — n) / (N — 1). Observe que cuando n es pequeña
en relación con N, este factor se aproxima a 1.
3.7 GRÁFICA
Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las
que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli)
de manera que en cada experiencia la probabilidad de obtener cada uno de los
dos posibles resultados se mantenía constante. Si el proceso consistía en una
serie de extracciones o selecciones ello implicaba la reposición de cada extracción
o selección, o bien la consideración de una población muy grande. Sin embargo, si
la población es pequeña y las extracciones no se remplazan las probabilidades no
se mantendrán constantes. En ese caso las distribuciones anteriores no nos
servirán para la modelizar la situación. La distribución hipergeométrica viene a
cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no
constantes (sin reemplazamiento).
La distribución hipergeométrica es especialmente útil en todos aquellos casos en
los que se extraigan muestras o se realizan experiencias repetidas sin devolución
del elemento extraído o sin retornar a la situación experimental inicial.
Modeliza, de hecho, situaciones en las que se repite un número determinado de
veces una prueba dicotómica de manera que con cada sucesivo resultado se ve
alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es
una distribución. fundamental en el estudio de muestras pequeñas de poblaciones
pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los que
no es posible retornar a la situación de partida.
La distribución hipergeométrica puede derivarse de un proceso experimental puro
o de Bernouilli con las siguientes características:
99
El proceso consta de n pruebas, separadas o separables de entre un conjunto de
N pruebas posibles.
Cada una de las pruebas puede dar únicamente dos resultados mutuamente
excluyentes: A y no A.
En la primera prueba las probabilidades son: P(A)= p y P(A)= q; con p + q =l.
Las probabilidades de obtener un resultado A y de obtener un resultado no A
varían en las sucesivas pruebas, dependiendo de los resultados anteriores.
(Derivación de la distribución). Si estas circunstancias a aleatorizamos de forma
que la variable aleatoria X sea el número de resultados A obtenidos en n pruebas
la distribución de X será una Hipergeométrica de parámetros N, np así
Un típico caso de aplicación de este modelo es el siguiente:
Supongamos la extracción aleatoria de n elementos de un conjunto formado por N
elementos totales, de los cuales Np son del tipo A y Nq son del tipo (p+q=l). Si
realizamos las extracciones sin devolver los elementos extraídos, y llamamos X. al
número de elementos del tipo A que extraemos en n extracciones X seguirá una
distribución hipergeométrica de parámetros N, n, p
Función de cuantía.
La función de cuantía de una distribución Hipergeométrica hará corresponder a
cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x
resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas
de entre las N posibles.
Veamos:
x del tipo , si partimos de una población formada por Np elementos del tipo A y
100
Media y varianza.
Considerando que una variable hipergeométrica de parámetros N, n, p puede
considerarse generada por la reiteración de un proceso dicotómico n veces en el
que las n dicotomías NO son independientes; podemos considerar que una
variable hipergeométrica es la suma de n variables dicotómicas NO
independientes.
Es bien sabido que la media de la suma de variables aleatorias (sean éstas
independientes o no) es la suma de las medias y por tanto la media de una
distribución hipergeométrica será, como en el caso de la binomial :
En cambio si las variables sumando no son independientes la varianza de la
variable suma no será la suma de las varianzas.
Esta forma resulta ser la expresión de la varianza de una binomial (n, p) afectada
por un coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o
Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que
produce la no reposición de los elementos extraídos en el muestreo.
Este coeficiente es tanto más pequeño cuanto mayor es el tamaño muestral
(número de pruebas de n) y puede comprobarse como tiende a aproximarse a 1
cuando el tamaño de la población N es muy grande . Este último hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposición o no cuando se
realizan extracciones sucesivas sobre una población muy grande. Con una
población muy grande se cual fuere el tamaño de n, el factor corrector sería uno lo
que convertiría, en cierto modo a la hipergeométrica en una binomial (ver D.
Binomial). Así
101
Límite de la distribución hipergeométrica cuando N tiende a infinito.
Hemos visto como la media de la distribución hipergeométrica [H{N,n,p)], tomaba
siempre el mismo valor que la media de una distribución binomial [B{n,p)] también
hemos comentado que si el valor del parámetro N crecía hasta aproximarse a
infinito el coeficiente de exhaustividad tendía a ser 1, y, por lo tanto, la varianza de
la hipergeométrica se aproximaba a la de la binomial : puede probarse asimismo ,
cómo la función de cuantía de una distribución hipergeométrica tiende a
aproximarse a la función de cuantía de una distribución binomial cuando
Puede comprobarse en la
representación gráfica de una
hipergeométrica con N =100000
como ésta ,es idéntica a la de
una binomial con los mismos
parámetros restantes n y p , que
utilizamos al hablar de la
binomial.
De manera análoga a como se
obtenía la moda en la distribución
binomial es fácil obtener la
expresión de ésta para la
distribución hipergeométrica. De
manera que su expresión X0
sería la del valor o valores
enteros que verificasen.
102
Al final de esta sección se comprueba el hecho de que, u y o 2 son la media y
varianza, respectivamente. Si X es una variable aleatoria cuya función de
densidad de probabilidad es normal con media u, y varianza o 2, se expresa como
x – (u,o2)
103
En general se convierte a unidades estándar al restar la media y dividir entre la
desviación estándar. Por consiguiente, si x es una unidad seleccionada de una
población normal con media u y varianza o2, la unidad estándar equivale a x es
el número z, donde:
104
Ejemplo 4.45
Los tiempos de vida de las baterías en cierta aplicación se distribuyen
normalmente con media de 50 horas y desviación estándar de cinco horas.
Determine la probabilidad de que se elija aleatoriamente una batería que dure
entre 42 y 52 horas.
Solución
Sea X el tiempo de vida de una batería elegida aleatoriamente. Entonces X —
N(50, 52). La figura 4.49 muestra la función de densidad de probabilidad de la
población N(50, 52). El área sombreada representa P(42 < X < 52), la probabilidad
de que una batería seleccionada de forma aleatoria tenga una duración entre 42 y
52 horas. Para calcular esta área, se hará uso de la tabla z. Primero se necesita
convertir las cantidades 42 y 52 a unidades estándar. Se tiene
De la
tabla z, el área a la izquierda de z = —1.60 es 0.0548, y el área a la izquierda de z
= 0.40 es 0.6554. La probabilidad de que una batería tenga tiempo de vida entre
42 y 52 horas es 0.6554 — 0.0548 = 0.6006.
Ejemplo 4.46
Con referencia al ejemplo 4.45, determine el 40o. percentil de los tiempos de vida
de las baterías.
Solución
De la tabla z, el área más cercana a 0.4000 es 0.4013, correspondiente al puntaje
z de —0.25. La población de los tiempos de vida tiene una media de 50 y una
desviación estándar de 5. El 40o. percentil es el punto 0.25 desviaciones estándar
menor a la media. Este valor se determina al convertir el puntaje z en uno nuevo,
utilizando la ecuación (4.24):
105
Al despejar x se tiene que x = 48.75. El 40o. percentil de los tiempos de vida de
las baterías es de 48.75 horas Véase la figura 4.10.
Ejemplo 4.47
Un proceso fabrica cojinetes de bolas cuyos diámetros se distribuye normalmente
con media de 2.505 cm y desviación estándar de 0.008 cm. Las especificaciones
requieren que el diámetro esté dentro del intervalo 2.5 ± 0.01 cm. ¿Qué proporción
de cojinetes de bolas cumple con la especificación?
Solución
Sea X el diámetro de un cojinete de bolas
seleccionado aleatoriamente. Entonces
X — N(2.505, 0.0082). La figura 4.11
presenta la función de densidad de
probabilidad de la población N(2.505,
0.0082). El área
sombreada
representa P(2.49 < X < 2.51), que es la proporción de
cojinetes de bolas que cumplen con la especificación. Se calcula los puntajes z
de 2.49 y 2.51:
106
El área a la izquierda de z = —1.88 es 0.0301. El área a la izquierda de z = 0.63
es 0.7357. El área entre z = 0.63 y z = —1.88 es 0.7357 — 0.0301 = 0.7056.
Aproximadamente 70.56% de los diámetros satisface la especificación.
Ejemplo 4.48
Con referencia al ejemplo 4.47, el proceso puede recalibrarse para que la media
sea igual a 2.5 cm, el centro del intervalo de la especificación. La desviación
estándar del proceso sigue siendo de 0.008 cm. ¿Qué proporción de los
diámetros satisface la especificación?
Solución
El método de solución es el mismo que en el ejemplo 4.47. La media es de 2.500
en vez de 2.505. Los cálculos se realizan de la siguiente manera:
El área a la izquierda
de z = - 1.25 es 0.1056. El área a la izquierda de z = 1.25 es 0.8944. El área entre
z = 1.25 y z = - 1.25 es 0.8944 - 0.1056 = 0.7888. Véase la figura 4.12. El
recalibrado aumenta a 78.88% la proporción de diámetros que satisface la
especificación.
107
Ejemplo 4.49
Con referencia a los ejemplos 4.47 y 4.48, suponga que se ha recalibrado el
proceso de tal forma que la media del diámetro mide ahora 2.5 cm. ¿A qué valor
debe reducirse la desviación estándar para que 95% de los diámetros satisfaga la
especificación?
Solución
El intervalo de especificación es 2.49 - 2.51 cm. Se debe encontrar un valor de u
para que este intervalo abarque 95% de la población de diámetros de cojinetes de
bolas. Véase la figura 4.13. El puntaje z que tiene 2.5% del área a la izquierda es
z= - 1.96. El pontaje z que tiene 2.5% del área a su derecha es z = 1.96 (esto
último se obtiene de la simetría de la curva). De ahí que el límite menor de la
especificación, 2.49, tenga un puntaje z de -1.96, mientras que el límite superior
de 2.51 tiene un puntaje z de 1.96. Cualesquiera de estos hechos se pueden
utilizar para encontrar a u. De la ecuación (4.24),
108
Combinaciones Lineales De Variables Aleatorios Independientes Normales
Una de las características más notables de la distribución normal consiste en que
las combinaciones lineales de variables aleatorias independientes normales son
en sí mismas variables aleatorias. Para ser más específico, suponga que X1 – N( μ
1, σ 1) - X2 – N(μ2, σ 2) son variables aleatorias independientes normales. Observe
que las medias y varianzas de estas variables aleatorias pueden diferir entre sí.
Sean c1, c2 constantes. Entonces, la combinación lineal c1x1 + c2x2 es una
variable aleatoria distribuida normalmente. La media y la varianza de la
combinación lineal son c1μ1 + c2μ2 respectivamente.
Ejemplo 4.50
109
Se concluye que E — N(2 500, 57 700).
Para calcular P(E > 3 000), se calcula el puntaje z: z = (3 000 — 2 500)/ √ 57 700 =
2.08. El área a la derecha de z = 2.08 debajo de la curva normal es 0.0188. Por
tanto, P(E > 3 000) = 0.0188.
110
En la práctica, a menudo se tiene una muestra de alguna población y se le debe
utilizar para decidir si la distribución de la población se aproxima a la normal. Si la
muestra es razonablemente grande, su histograma es buena indicación. Las
muestras grandes de poblaciones normales tienen histogramas que se parecen a
la función de densidad normal: con un pico en el centro, y decrecientes más o
menos simétricamente en cada lado. Las gráficas de probabilidad son otra buena
forma de determinar si una muestra grande proviene de una población que es
aproximadamente normal. Para muestras pequeñas, es difícil determinar si la
distribución normal es apropiada.
Un hecho importante es éste: las muestras de poblaciones normales raramente
tienen datos atípicos. Por tanto, no se utiliza la distribución normal en conjuntos de
datos que tengan valore atípicos. Esto es cierto cuando el tamaño muestral es
pequeño. Infortunadamente, par conjuntos pequeños de datos que no tienen datos
atípicos, es difícil determinar si la población es aproximadamente normal. En
general, se requiere de cierto conocimiento de proceso que generó los datos.
111
Ejercicios para la sección 4.5
1. Determine el área bajo la curva normal
a) A la derecha de z = - 0.85.
b) Entre z= 0.40 y z = 1.30.
c) Entre z - 0.30 y z = 0.90.
d) Desde z = - 1.50 hasta z = - 0.45.
4. Suponga que la estatura de mujeres en una población sigue la curva normal con
media de 64.3 pulgadas y desviación estándar de 2.6 pulgadas.
a) ¿Qué proporción de mujeres tiene estatura entre 60 y 66 pulgadas?
b) La estatura de una mujer es 0.5 de desviación estándar mayor a la media.
¿Qué proporción de mujeres mide más que ella?
c) ¿Cuánto mide una mujer cuya estatura se encuentra en el 90o. percentil?
d) Se elige aleatoriamente una mujer de esta población. ¿Cuál es la probabilidad
de que ella mida más de 67 pulgadas?
e) Se elige aleatoriamente a cinco mujeres de esta población. ¿Cuál es la
probabilidad de que sólo una de ellas mida más de 67 pulgadas?
112
azúcar es de 4.9 mg/ml. Si la concentración excede los 6 mg/ml, el hongo muere y
el proceso debe suspenderse todo el día.
a) Si la concentración de azúcar en tandas de caldo se distribuye normalmente
con media 4.9 mg/ml y desviación estándar 0.6 mg/ml, ¿en qué proporción de días
se suspenderá el proceso?
b) El distribuidor ofrece vender caldo con una concentración de azúcar que se
distribuye normalmente con media de 5.2 mg/ml y desviación estándar de 0.4
mg/ml. ¿Este caldo surtirá efectos con menos días de producción perdida?
Explique.
113
c) Si se establece que la media mide 0.650 cm, ¿cuál debe ser la desviación
estándar para que 99% de los ejes cumpla con la especificación?
11. El volumen de latas llenadas por cierta máquina se distribuye con media de
12.05 onzas y desviación estándar de 0.03 onzas.
a) ¿Qué proporción de latas contiene menos de 12 onzas?
b) La media del proceso se puede ajustar utilizando calibración. ¿En qué valor
debe fijarse la media para que 99% de las latas contenga 12 onzas o más?
c) Si la media del proceso sigue siendo de 12.05 onzas, ¿en qué valor debe
fijarse la media para que 99% de las latas contenga 12 onzas o más?
13. Un proceso hilador de fibras produce una fibra cuya resistencia se distribuye
con media de 75 N/m2. La resistencia mínima aceptable es de 65 N/m2.
a) 10% de las fibras producidas mediante el método actual no cumple con la
especificación mínima. ¿Cuál es la desviación estándar de la resistencia de las
fibras en el proceso actual?
b) Si la media sigue siendo de 75 N/m2, ¿cuál debe ser la desviación estándar
para que sólo 1% de las fibras no satisfaga la especificación?
c) Si la desviación estándar es de 5 N/m2, ¿en qué valor debe fijarse la media
para que sólo 1% de las fibras no satisfaga la especificación?
114
b) Con base en su respuesta al inciso a), si el proceso funciona bien, ¿una fuerza
de 160 N sería inusualmente pequeña? Explique.
c) Si usted observa una fuerza adhesiva de 160 N, ¿esto último sería una
evidencia de que el proceso ya no funciona correctamente? Explique.
d) Encuentre P (X 203), bajo la suposición de que el proceso está funcionando
bien.
e) Con base en su respuesta del inciso d), si el proceso funciona correctamente,
¿sería una fuerza de 203 N inusualmente grande? Explique.
f) Si usted observa una fuerza adhesiva de 203 N, ¿lo anterior sería una evidencia
de que el proceso ya no funciona correctamente? Explique.
g) Encuentre P (X -5- 195), bajo la suposición de que el proceso está funcionado
bien.
h) Con base en su respuesta del inciso g), si el proceso está funcionando
correctamente, ¿sería una fuerza de 195 N inusualmente pequeña? Explique.
i) Si usted observa una fuerza adhesiva de 195 N, ¿esto sería una evidencia de
que el proceso ya no funciona correctamente? Explique.
15. Una instalación de luz tiene dos focos. El A es de un tipo cuya duración se
distribuye con media de 800 horas y desviación estándar de 100 horas. El B tiene
una duración que se distribuye con media de 900 horas y desviación estándar de
150 horas. Suponga que las duraciones de los focos son independientes.
a) ¿Cuál es la probabilidad de que el foco B dure más que el A?
b) ¿Cuál es la probabilidad de que el foco B dure 200 horas más que el A?
c) Otra instalación de luz tiene sólo un foco. Se pone uno del tipo A y cuando se
funde se instala otro de tipo B. ¿Cuál es la probabilidad de que la duración total de
ambos sea mayor a 2 000 horas?
16. La molaridad de un soluto en solución se define como el número de moles del
soluto por litro de solución (1 mol = 6.02 x 1023 moléculas). Si X es la molaridad
de una solución de cloruro de sodio (NaC1) y Y es la molaridad de una solución de
carbonato de sodio (Na2CO3), la molaridad del ion de sodio (Na+) en una solución
hecha de partes iguales NaC1 y Na2CO3 está dada por M = 0.5X + Y. Suponga
que X y Y son independientes y se distribuyen normalmente y que X tiene media
de 0.450 y desviación estándar de 0.050, y Y tiene media de 0.250 y desviación
estándar de 0.025.
a) ¿Cuál es la distribución de M?
115
17. Una compañía recibe importante cargamento de pernos. Éstos se utilizarán en
una aplicación que necesita de una torsión de 100 J. Antes de que se acepte el
cargamento, un ingeniero especialista en control de calidad sacará una muestra
de 12 pernos y medirá la torsión necesaria para romper a cada uno de ellos. El
cargamento será aceptado si el ingeniero concluye que menos de 1% de los
pernos tiene torsión de ruptura menor a 100 J.
a) Si los 12 valores son 107, 109, 111, 113, 113, 114, 114, 115, 117, 119, 122,
124, calcule la media y la desviación estándar muestral.
b) Suponga que se saca una muestra de 12 valores de una población normal, y
suponga que la media y la desviación estándar muestrales calculadas en el inciso
a) son realmente la media y la desviación estándar de la población. Calcule la
proporción de pernos cuya torsión de ruptura es menor a 100 J. ¿Será aceptado el
cargamento?
c) ¿Qué pasará si los 12 valores hubieran sido 108, 112, 114, 114, 115, 115, 116,
118, 120, 123, 140? ce el método descrito en los incisos a) y b) para? minar si el
cargamento hubiera sido aceptado.
d) Compare los conjuntos de 12 valores en los inciso c). ¿En qué muestra los
pernos son más resistente:
e) ¿El método es válido para ambas muestras? ¿por o por qué no?
Distribución Logarítmico-normal
Para datos que tienen valores atípicos, la distribución normal no es apropiada. La
distribución lognormal que tiene relación con la distribución normal, es, a menudo,
buena opción para estos conjuntos de datos. La distribución lognormal se deriva
de la distribución normal de siguiente manera: Si X es una variable aleatoria
normal con media u y varianza o2, entonces la variable aleatoria Y = e x tiene
distribución lognormal con parámetros u y o 2, entonces X = ln y tiene una
distribución normal con media u y varianza o 2.
La
función de densidad de probabilidad de una variable aleatoria lognormal con
parámetros u y o2 es:
116
La figura 4.14 presenta una gráfica de la función de densidad lognormal con
parámetros u = 0 y o = 1. Observe que la función de densidad está sesgada. Ésta
es la razón por la que se utiliza la distribución lognormal para modelar procesos
que tienden a producir ocasionalmente valores grandes o atípicos.
Observe que, si Y
tiene una distribución normal, los parámetros u y o 2 no se refieren a la media y
varianza de Y, sino que lo hacen a la media y varianza de la variable aleatoria
normal ln Y, se utiliza la notación E(Y) en vez de que u y y V(Y) lugar de oy, para
evitar confusiones entre u y o.
Ejemplo 4.51
El tiempo de vida de cierto componente sigue una distribución lognormal con
parámetros u = 1 día
El tiempo de vida de cierto componente sigue una distribución lognormal con
parámetros p, = 1 día y o- = 0.5 días. Determine la media del tiempo de vida de
estos componentes. Encuentre la desviación estándar de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente escogido aleatoriamente. La media de
Y determinada mediante la ecuación (4.30) es e' + 0.52/2 = 3.08 días. La varianza
117
es e2(1) + 2(0.5)2 e2(1) + (0.5)2 = 2.6948. Por tanto, la desviación estándar es
12.6948 = 1.64 días.
Para calcular las probabilidades de variables aleatorias lognormales, se saca el
logaritmo y se utiliza la tabla z (tabla A.2). Los ejemplos 4.52 y 4.53 ilustran el
método.
Ejemplo 4.52
Con referencia al ejemplo 4.51, encuentre la probabilidad de que un componente
dure cuatro días.
Solución
Sea Y el tiempo de vida de un componente seleccionado de forma aleatoria. se
necesita calcular P (Y > 4). No se puede utilizar la tabla z para Y, debido a que Y
no proviene de una población norma. Sin embargo, In Y proviene de una población
normal; específicamente N (1, 0.52). Se expresa P (Y > 4) como una probabilidad
que implica a In Y:
118
Ejemplo 4.53
Con referencia al ejemplo 4.51 determine la mediana de los tiempos de vida.
Encuentre 80º percentil de los tiempos de vida.
Solución
Sea Y el tiempo de vida de un componente escogido aleatoriamente. Sea m la
mediana de los tiempos de vida. Entonces P (Y<m) = 0.5. en los logaritmos se
tiene que P (Y ln <ln m) = 0.5.
Esto significa que ln m es la mediana de ln y. ahora, ln Y – (1.05) Por
consecuencia ln m = 1, por lo que m = e = 2.718.
Para encontrar al 80º percentil se hace P (Y < P 80) = .80.
Por lo que P (ln Y < ln p80) = 0.80
P80) 0.80. Esto significa que In p80 es el 80o. percentil de In Y. Ahora In Y —
0.52).
Estimación De Los Parámetros De Una Distribución Lognormal
Ejemplo 4.53
Los diámetros (en mm) de las semillas de cierta planta siguen una distribución
normal. Una muestra aleatoria de cinco semillas tiene los diámetros 1.52, 2.22,
2.64, 2.00 y 1.69. Estime los parámetros u y o.
Solución
Para estimar p. y u, se sacan los logaritmos de los cinco valores de la muestra,
para obtener 0.419, 0.798, 0.971, 0.693 y 0.525. La media muestral es 0.681 y la
desviación estándar muestral es 0.218. Por consecuencia, se estima que µ =
0.681, é; = 0.218.
3.10 GRÁFICA
119
Observe que la densidad lognormal tiene sólo una cola larga, a la derecha. Por
esta razón, las muestras de poblaciones lognominoales tienen datos atípicos a la
derecha, pero no a la izquierda. Por consiguiente, no debe utilizarse la distribución
lognormal en muestras con inusualmente muy pocos datos. Además, las
poblaciones lognormales sólo tienen valores positivos, por lo que no puede
emplearse la distribución lognormal en muestras que contengan ceros o valores
negativos. Por último, es importante observar que la transformación log no
siempre genera una muestra que se aproxima a la normal. Para verificar lo
anterior, se tiene que graficar un histograma o un gráfico de probabilidad (véase la
sección 4.9).
La figura 4.16 presenta dos histogramas. El primero muestra la producción
mensual de 255 pozos de gas, en unidades de miles de pies cúbicos. El
histograma claramente tiene una larga cola derecha, por lo que se concluye que
los datos no provienen de una población normal. La segunda muestra los
logaritmos naturales de las producciones mensuales. Este histograma se aproxima
más a la curva normal, aunque se percibe cierta diferencia con la normalidad.
Histograma que muestra la producción mensual de 225 pozos de gas. Tiene una
larga cola derecha. Histograma que muestra los logaritmos naturales de as
producciones mensuales. Las distribuciones de los datos logarítmicos se
aproximan mucho más a la normal.
Ejercicios para la sección 4.6
1. El tiempo de vida (en días) de cierto componente electrónico que opera en un
ambiente a alta temperatura sigue una distribución lognormal con p, = 1.2 y o =
0.4.
a) Determine la media del tiempo de vida.
120
b) Determine la probabilidad de que un componente dure entre tres y seis días.
c) Determine la mediana del tiempo de vida.
d) Determine al 90o. percentil de los tiempos de vida.
121
c) Determine la desviación estándar del riesgo
d) Determine el 5º. Percentil
e) Determine el 95º. Percentil
5. El artículo “Withdrawl Strenght of threaded nails” describe un experimento que
compara la resistencia final a ser retirados (en N/mm) de varios tipos de clavos.
Para un clavo con rosca anular y un vástago de diámetro de 3.76 mm introducido
en una madera de pinabete, pino y abeto, la resistencia final de retiro fue
modelada como una lognormal con u = 3.82 y o = 0.219. Para un clavo con rosca
en espiral, bajo las mismas condiciones, la resistencia se modeló como una
lognormal con u = 3.47 y 0 = 0.272
a) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca espiral?
b) ¿Cuál es la media de la resistencia de retiro para los clavos con rosca anular?
c) ¿Con qué tipo de clavo es más probable que la fuerza de retiro sea mayor a 50
N/mm?
d) ¿Cuál es la probabilidad de que un clavo con rosca en espiral tenga una
resistencia mayor a ser retirado que la mediana de los clavos con rosca anular?
e) Se realiza un experimento en el cual se mide las resistencias a ser retirados de
diversos clavos de los dos tipos. Se registra que un clavo tiene resistencia a ser
retirado de 20 N/mm, pero no se sabe el tipo. ¿Piensa que se trata de un clavo
con rosca anular o espiral? ¿Por qué? ¿Qué tan seguro está?
iii) La media puede ser mayor que, menor que, o igual que la mediana,
dependiendo del valor de o.
122
a) Determine la media del precio de una acción de la compañía A en un año a
partir de ahora.
f) Si usted observa una resistencia a la tensión de 130 MPa, ¿esto sería una
evidencia de que la afirmación es falsa? Explique.
123
De acuerdo con el procedimiento del ejemplo 4 para la determinación de un punto
percentil en la distribución normal estándar, un punto percentil en una variable
aleatoria con distribución normal se determina despejando en la fórmula (7.2) X (y
no z), con lo que se obtiene:
X=u + zo
Ejemplo 5
En el caso de la vida útil del componente eléctrico que se describe en los ejemplos
2 y 3, y empleando la solución del ejemplo 4, el punto percentil 90 de vida útil del
componente es
X =zo- = 2000 + (1.28) (200) = 2256 horas
Para los puntos percentiles abajo del percentil 50, el valor de z será siempre
negativo, ya que en la distribución normal estándar este valor es menor que 0, que
es la media.
Ejemplo 6
124
3.11 APROXIMACIÓN DE LA NORMAL A LA BINOMIAL
U = np
125
(Nota: Esto comprende la corrección por continuidad que se estudia a
continuación.)
126
probabilidades con la Normal en lugar de con la Binomial y de una forma más
rápida.
En resumen, se utiliza la aproximación Normal para evaluar probabilidades
Binomiales siempre que p no esté cercano a 0 o 1. La aproximación es excelente
cuando n es grande y bastante buena para valores pequeños de n si p está
razonablemente cercana a ½. Una posible guía para determinar cuándo puede
utilizarse la aproximación Normal es tener en cuenta el cálculo de np y nq. Sí
ambos, np y nq son mayores o iguales a 5, la aproximación será buena.
Antes de empezar a resolver problemas con la aproximación Normal, es bueno
aclarar que se están evaluando probabilidades asociadas a una variable discreta
x, con una distribución que evalúa variables de tipo continuo como es la Normal,
Por lo que z sufre un pequeño cambio como se muestra a continuación:
127
3.13 GRÁFICA
128
¿Sabías que…
En la referencia
estadística se
conoce como
muestreo a la
técnica para la
selección de una
muestra a partir
de una población
estadística.
UNIDAD 4
MUESTREO
129
4.- MUESTREO
4.1 DEFINICIÓN DE MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya
función básica es determinar que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que
se reproduzca de la mejor manera los rasgos esenciales de dicha población que
son importantes para la investigación. Para que una muestra sea representativa, y
por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la
población, es decir ejemplificar las características de ésta.
4.1.1 TIPOS DE MUESTREO ALEATORIO, SISTEMATIZADO,
ESTRATIFICADO Y CONGLOMERADO.
130
Para utilizar esta tabla con el propósito de seleccionar una muestra de empleados
primero se elige un Punto de partida en la tabla. El número es 03759. Debido a
que sólo hay 845 empleados se utilizarán los primeros 3 dígitos de un número
aleatorio de 5 dígitos. Por lo tanto 037 es el número de primer empleado que será
miembro de la muestra. Otra forma de seleccionar El punto de partida es cerrar los
ojos y apuntar a un número de la tabla para continuar seleccionando a los
empleados se puede mover en todas direcciones. Suponga que el movimiento es
a la derecha. Los primeros 3 dígitos de la cifra a la derecha de 03759 son 447: el
número del segundo miembro de la muestra. Los primeros tres dígitos del
siguiente número a la derecha son 96 1. Se salta este número porque sólo hay
845 empleados se continúa la derecha y se selecciona la empleada 784 luego 189
y así sucesivamente.
Un estudio de Marian Bryson y Robert Manson ilustra aún más es uso de una
tabla de números aleatorios y el muestreo aleatorio simple.
En 18 bodegas en un depósito del ejército estadounidense se encontraban 186
810 insumos militares diferentes, tales como llantas, tuercas, pernos, orugas de
tanque y rines para llantas. En cada bodega Había naves y en cada nave había
depósitos. Por ejemplo, en la bodega 17 se almacenaron partes para vehículos de
motor. La nave 260, depósito 2, contenía cigüeñales para jeeps. La nave 260,
depósito 3, tenía tapones de radiador para jeeps.
El problema suponía seleccionar un estante de una bodega al azar, y contar el
número de artículos que contenía. Luego se comparaba el conteo físico contra el
número de los registros de inventario indicaban que debería haber. Así el
problema era básicamente el inventario físico, que abarcaría varios métodos de
131
muestreo. El objetivo de proyecto de investigación consistía en determinar qué tan
precisos eran los registros. Para asegurar que cada depósito tenía las mismas
oportunidades de ser seleccionado, se empleó una tabla de números aleatorios a
fin de escoger bodega, nave y estante. Si se seleccionaba la bodega 5, nave 455,
depósito 6, un verificador iba a este lugar dar el número de artículos que estaban
en ese depósito.
¿Por qué se eligió un método tan oneroso en cuanto al tiempo para seleccionar los
depósitos que serían parte de la muestra? La otra alternativa era permitir a los
verificadores contar los artículos en cualesquiera depósitos que eligieran ellos
mismos. Sin duda los verificadores habrían evitado contar los artículos en
cualesquiera depósitos que contuvieran partes pesadas o llenas de grasa Y quizá
también había ignorado los depósitos en la parte más alta, a 6 metros por encima
del suelo del almacén. Las omisiones de los artículos en esos depósitos del
intervalo físico podrían haberse dado los resultados: es decir habría dado una
imagen falsa de la precisión de los registros.
Autoevaluación 6 – 1
La lista de clase que se encuentra en la página siguiente, enumera los alumnos
inscritos en un curso de introducción a la estadística de negocios, se seleccionará
a 3 estudiantes a quienes se les harán varias preguntas respecto del contenido y
método de instrucción del curso
a) Se escriben los números 00 a 45 en trozos de papel y se colocan en un
tazón. Los 3 números seleccionados son 31,07 y 25. ¿A qué estudiantes
se incluirán en la muestra?
b) Ahora utilice la tabla de números aleatorios, apéndice E, para seleccionar
su propia muestra.
c) ¿Qué harías si se encontrará con el número 59 en la tabla de números
aleatorios?
Muestreo aleatorio sistemático
El procedimiento de muestreo aleatorio simple puede ser difícil en ciertos casos.
Por ejemplo, suponer que la población que interesa consiste en 2000 facturas que
se localizan en cajones. Tomar una muestra aleatoria sencilla requería primero
numerar las facturas del 0000 al 1999. Utilizando una tabla de números aleatorios,
se selecciona luego una muestra de. por ejemplo 100 números. Luego en los
cajones de veras localizarse una factura que concuerde con cada uno de los 100
números. Esta área puede requerir mucho tiempo. En vez de ello se podría
seleccionar una muestra aleatoria sistemática recorriendo simplemente los
cajones, contando las facturas y tomando todas las que hagan el número 20 del
grupo, para su estudio. La primera factura debería elegirse utilizando un proceso
aleatorio: por ejemplo, una tabla de números aleatorios. Si se eligió la décima
factura como punto de partida, la muestra consistiría en las facturas décima,
trigésima, quincuagésima, septuagésima…Debido a que el primer número se elige
132
al azar todos tienen la misma posibilidad de seleccionarse para la muestra. Por lo
tanto, se trata de un muestreo probabilístico.
Muestreo aleatorio sistemático. Se acomodan los elementos o personas de la
población en cierta forma. Se selecciona un punto de partida aleatoria y luego se
toman cada k-ésimo miembro para formar parte de la muestra.
Numero Nivel Numero Nivel
aleatorio Nombre academico aleatorio academico
0 EDGARDO Segundo 23 ERASMO Segundo
1 EDITH Segundo 24 ERICO Primero
2 EDMUNDO Primero 25 ERIC Segundo
3 EDUARDO Primero 26 ERICA Segundo
4 EFRAÍN Segundo 27 ERNESTO Tercero
5 EFRÉN Tercero 28 ESMERALDA Segundo
6 ELENA Segundo 29 ESPERANZA Segundo
7 ELEONOR Tercero 30 ESTEBAN Tercero
8 ELÍAS Segundo 31 ESTEFANÍA Segundo
9 ELISA Tercero 32 ESTELA Cuarto
10 ELISABETH Cuarto 33 ESTER Segundo
11 ELOISA Cuarto 34 ETEL Segundo
12 ELOY Tercero 35 EUCLIDES Cuarto
13 ELSA Tercero 36 EUDOSIA Segundo
14 ELVIRA Segundo 37 EUDOXIO Segundo
15 EMILIA Segundo 38 EUFEMIO Segundo
16 EMILIO Segundo 39 EUFEMIA Segundo
17 EMA Tercero 40 EUFRASIO Segundo
18 EMANUEL Primero 41 EUFRASIA Segundo
19 EMILIO Segundo 42 EUGENIO Segundo
20 ENCARNACIÓN Segundo 43 EUGENIA Segundo
21 ENGRACIA Segundo 44 EULALIO Segundo
22 ENRIQUE Tercero 45 EULALIA Tercero
133
Este procedimiento sistemático seleccionó 4 depósitos llenos con artículos de
movimiento relativamente rápido, y otros cuatro que están llenos con artículos de
movimiento rápido o lento. La división por Mitades de la muestra no coincide con
las características reales de la población. La población consiste en 16 depósitos
con movimientos de relativa rapidez y 4 de artículos de movimiento rápido o lento.
Sin duda el resultado de la muestra estaría insesgados hacia los artículos de
movimiento rápido o lento.
Muestreo aleatorio estratificado
Otro tipo de muestreo probabilístico es el muestreo aleatorio estratificado
Muestreo aleatorio estratificado: se divide la población en subgrupos llamados
estratos y se selecciona una muestra de cada uno de ellos.
Una vez que la población se divide en estratos, es posible seleccionar una
muestra proporcional y no proporcional. Como nombre no implica, un
procedimiento de muestra proporcional requiere qué número de artículos de cada
estrato esté en la misma proporción que en la población. Por ejemplo, el problema
podría ser estudiar los gastos de publicidad de las 352 empresas estadounidenses
mayores. Suponer que el objetivo del estudio consiste en determinar si las
empresas con altos rendimientos sobre su inversión (una medición de rentabilidad)
han gastado una mayor proporción de sus presupuestos de ventas en publicidad
que las empresas que tienen un menor rendimiento o incluso un déficit. Suponer
que las 352 empresas se dividen en 5 estratos (véase la ilustración) si se han de
seleccionar para su estudio intensivo por decir 50 empresas entonces se debería
incluir una empresa con nivel de rentabilidad de 30% o más cinco empresas en el
estrato de 20 a 30% se seleccionan al azar, etcétera.
En una muestra estratificada no proporcional, la cantidad de artículos que se
seleccionan en cada estrato no guarda proporción con los números respectivos en
la población. Independientemente de que se usa en un procedimiento de muestra
proporcional o no proporcional, cada elemento o persona la población tiene la
misma oportunidad de que se seleccionan para muestra.
134
En algunos casos, el muestreo estratificado tiene la ventaja de poder reflejar con
mayor precisión las características de la población que un muestreo aleatorio
simple sistemático. Observa en la instrucción que el 2 por ciento de las empresas
tienen un rendimiento sobre la inversión de 30 por ciento o más (estrato 1) y el 1%
por ciento tiene un déficit (estrato 5). Si se tomara una muestra aleatoria simple de
50 empresas quizás por azar no se había seleccionado ninguna empresa en los
estratos 1 0 5. Una muestra aleatoria estratificada aseguraría que al menos una
empresa del estrato 1 y otra es el estrato 5 están representadas en la muestra.
135
La discusión de los métodos de muestreo en las elecciones presidente concluyó la
totalidad de los métodos de muestreo que se dispone un investigador. Cuando se
toma parte de un proyecto de investigación en mercadotecnia finanzas
contabilidad u otras áreas, quizá se requiera consultar libros dedicados una
manera exclusiva la teoría y el diseño muestras.
Autoevaluación 6 – 2
Haga referencia a la autoevaluación y la lista de clase de la página pasada.
Suponga que una muestra consistirá en cada noveno estudiante inscrito en clase.
Al principio se selecciona al azar al cuarto estudiante de la lista. Ese estudiante
tiene el número 03. Recordando que los números aleatorios comienzan con 00,
¿Qué estudiantes se seleccionará para ser miembro de la muestra?
Ejercicios
1.-A continuación, se enumeran los 35 miembros de la asociación de distribuidores
de automóviles el área metropolitana de Tulsa Oklahoma.
136
Numero de Distribuidor Número de Distribuidor
identificación identificación
0 Bravo Guzmán 18 Kenia Cabrera
1 Amira torres 19 Airam morales
2 José Fernández 20 Yazmin López
3 Isamar Gutiérrez 21 Andrea Padilla
4 Rosa Itzel 22 José Reyes
5 David Márquez 23 María del Rosario
6 Gustavo Aguilar 24 Antonio Ramírez
7 David Sámano 25 Karen Moreno
8 Lucero Fernández 26 Melany Hernández
9 Diana Covarrubias 27 Josué Cruz
10 Ernesto Pérez 28 Omar Arellano
11 Virginia Muñoz 29 Alfredo Aldazaba
12 José Rogel 30 Gerardo Ortiz
13 Iban Bravo 31 Jenifer López
14 Kimberly Contreras 32 Yaremi Cortez
15 Liliana Castañeda 33 Mariana Córdoba
16 Adriana Flores 34 Felicia Martínez
17 María Salazar 35 Adolfo Patlani
137
8 Lucero Fernández 20 Melany
Hernández
9 Diana Covarrubias 21 Josué Cruz
10 Ernesto Pérez 22 Omar Arellano
11 Virginia Muñoz 23 Alfredo Aldazaba
Error en el muestreo
El análisis anterior acentúa la importancia de seleccionar una muestra a fin de
que todos los artículos de la muestra tengan la misma oportunidad de ser
elegidos. Para lograr esto, se puede seleccionar una muestra aleatoria simple, una
muestra sistemática, una muestra estratificada, una muestra por conglomerado o
una combinación de estos métodos. Sin embargo, es improbable que la media de
la muestra fuera idéntica a la media de la población.
Asimismo, talvez la desviación estándar otra medición que se calcula con base en
la muestra no sea Exactamente igual al valor correspondiente de la población. Así
es posible que existan ciertas diferencias entre las estadísticas de la muestra
como la media y la desviación estándar de la muestra y los parámetros de la
población correspondiente. La diferencia entre un estadístico de la maestra y un
parámetro de la población se conoce como error de muestreo.
Error de muestreo. Diferencia entre un estadístico de la muestra y el parámetro
correspondiente de la población.
Suponga que las calificaciones de eficiencia de una población de 5 empleados de
producción fueron 97, 103, 96,99 y 105. Asimismo, se pongan que una muestra de
dos calificaciones, 97 y 105, es seleccionada para calcular la media de la muestra.
Está sería 101 que se obtiene mediante 97 más 105 entre 2 otra muestra de 2
calificaciones sería 103 y 96 con una media de muestra de 99.5 la medida de
todas las calificaciones es decir la media de la población es 100 que se encuentra
mediante: (93 +103+96+99 +105) / 5= 100 . El error de muestreo de la primera
muestra es de 1.0 que se determina por x-µ= 101- 100. La segunda muestra tiene
un error de muestreo de -0.5. Ambas diferencias 1.0 y -0.5 son errores que se
138
cometen al estimar la media de la población mediante una media de muestra y sus
errores de muestreo deben al azar. Los tamaños de estos errores varían de una
muestra a otra
4.2 CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA
La distribución muestral de un estadístico es una distribución de probabilidad
constituida por cada uno de los valores que puede asumir el estadístico en todas
las muestras de tamaño n posibles de extraer sin reposición en una población de
tamaño N. Dados los valores de la población y la muestra el número de muestras
posibles a extraer se calcula como combinación.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una
población grande. Se calcula la media muestral X para cada muestra; la colección
de todas estas medias muestrales recibe el nombre de distribución muestral de
medias.
La distribución muestral de las medias muéstrales asume como la media el valor
del parámetro poblacional µ y la desviación típica de la distribución muestral de
medias- denominado error estándar o error típico.
Error estándar de la media: Es la desviación estándar de la distribución de
muestreo de la media, por lo que mide el grado en que se espera que varíen las
medias de las diferentes muestras de la media de la población, debido al error
aleatorio en el proceso de muestreo.
El Teorema del Límite Central también nos indica que cuando se extraen muestras
de tamaño mayor a 30 o bien de cualquier tamaño pero provenientes de una
población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución
normal con:
Puede conocerse empíricamente, según se ha visto, efectuando dos operaciones.
A saber, extrayendo todas las muestras posibles de tamaño n de una población de
tamaño N y calculando para cada muestra la media y probabilidad asociada.
139
Ejemplos 5.1 desearíamos extraer conclusiones respecto a las estaturas de 12000
estudiantes examinando solamente 100 estudiantes seleccionados de esta
población.
Ejemplo 5.2 desearíamos extraer conclusiones respecto al porcentaje de tornillos
defectuosos producidos en una fábrica durante una semana de 6 días examinando
20 tornillos diariamente producidos en tiempos diferentes durante el día. En este
caso los tornillos producidos durante la semana conforman la población en tanto
que los 120 tornillos Escogidos constituyen la muestra.
Ejemplo 5.3 desearíamos extraer conclusiones respecto a la honradez de una
moneda determinada a lanzar repetidamente. La población consiste en todos los
lanzamientos posibles de la moneda. Se podría obtener una muestra al examinar,
por ejemplo, los primeros 60 lanzamientos de la moneda notar caras y sellos.
Ejemplos 5.4 Desearíamos extraer conclusiones Respecto a los colores de 200
bolas en una urna una muestra de 20 bolas de la urna, donde cada bola
seleccionada se regresa luego de observar su color.
Deben notarse varias cosas. Primero la palabra población no tiene
necesariamente el mismo significado como en el lenguaje común, como en " la
población de determinada ciudad es de 180.000".
Segundo, la palabra población se utiliza para denotar Las observaciones o
medias y no los individuos u objetos. Así en él ejemplo 5.1 podemos hablar de la
población de 12,000 estaturas, en tanto que en el ejemplo 5.4 podemos hablar de
la población de todos los 200 colores en la urna.
Tercero la población puede ser finita o infinita, el número se llama el tamaño de la
población, comúnmente denotado por N. En forma semejante el número de la
muestra se llama el tamaño de la muestra, denotado por n, generalmente finito. En
el ejemplo 5.1, N= 12,000, n= 100 mientras que en el ejemplo 5.3 N= infinito n=60.
Muestreo con y sin remplazamiento
Sí, extremos un objeto de una urna, tenemos la alternativa de colocarlo o no en la
urna antes de una segunda extracción. En el primer caso puede seleccionarse un
objeto determinado una y otra vez, mientras que en el segundo caso solamente
puede seleccionarse una vez. El muestreo donde cada miembro de una población
puede seleccionarse más de una vez se llama muestreo con reemplazamiento,
mientras que si cada miembro no puede seleccionarse más de una vez se llama
muestreo sin reemplazamiento.
Por simplicidad supongamos que el muestreo es con remplazamiento de modo
que el mismo individuo podría conceptualmente escogerse más de una vez. En
este caso ya que con el tamaño de la muestras es mucho más pequeño que el
140
tamaño de la población, el muestreo sin remplazamiento daría realmente los
mismos resultados que el muestreo con remplazamiento.
En el caso general una muestra de tamaño n se describiría por los valores x 1, x2,…,
xn de las variables aleatorias X1, X2,…, Xn. En el caso de muestreo con
remplazamiento X1, X2,…, Xn. serian variables aleatorias independientes distribuidas
idénticamente con distribución de probabilidad f (x). Entonces su distribución
conjunta seria
P(X1=x1, X2=x2…, Xn=xn)= f(x1) f(x2)…. f (xn).
En analogía si x1, x2,…, xn denotan los valores obtenidos en una muestra especifica
de tamaño n entonces la media para esa muestra se denota por
141
x 1+ x 2 … .+ xn
x=
n
Teorema 5.1 La media de la distribución muestral de medias, denotada por μ X, está dada por
E ( x ¿=¿ μ X= μ
Donde μ es la media de la población.
El teorema 5.1 establece que el valor de la media muestral es la media de la población.
142
Teorema 5.2 Si una población es infinita o si el muestreo es con remplazamiento, entonces la
varianza de la distribución muestral de medias, denota por α2 x́ esta dada por
α2
E [ ( X −μ )2]=
n
donde α 2 es la varianza de la población
α 2 α 2 N −n
= ¿ )
n n N−1
Nótese que (6) se reduce a (5) cuando N=∞
Teorema 5.4 Si la población de la cual se toman las muestras tiene una distribución de
probabilidad con media μ y varianza α2 entonces la media muestral esta normalmente
distribuida con media μ y varianza α^2/n
Teorema 5.5 Si la población de la cual se toman las muestras tiene una distribución de
probabilidad con media μ y varianza α2 que no necesariamente tiene una distribución normal.
Entonces la variable tipificada asociada con X, dada por
Z= ( X ̅-μ)/( α/√n)
El teorema 5.5 es una consecuencia del teorema del límite central página 112. Se
supone aquí que la población es infinita o que el muestreo es con remplazamiento.
De otra forma lo anterior es correcto si remplazamos α / √ n en (7).
143
4.2.1 DISTRIBUCION MUESTRAL DE LA MEDIA CON VARIANZA
DESCONOCIDA Y CONOCIDA
Si X ¿ ,
T .C.L. Si n 30 X N ,
n
X-
N 0,1
n
144
Considere una población cuyo comportami ento está caracteriz ado por el de una v.a. N( , )
N(50,100). Si de tal población se toma una muestra de tamaño n 25. Calcular :
1) La probabilid ad de que X 60
2) P(48 x 51)
100
X N (50,100) X N 50,
25
145
4.2.2 DISTRIBUCION MUESTRAL DE LA DIFERENCIA ENTRE DOS MEDIAS
CON VARIANZA DESCONOCIDA Y CONOCIDA
x y x y
x2 y
2
xy
nx n y
x2 y
2
x y N x y ,
nx n y
( x y ) x y
N (0,1)
2
y2
x
nx n y
146
147
Distribución de la diferencia de medias muestrales cuando no se conoce la
varianza poblacional
MODELO MATEMATICO
Un agricultor utiliza una semilla híbrida que produce 90 Tm. Por hectárea y un
productor le ofrece una semilla también híbrida que produce 110 Tm. por Hora. En
5 parcelas diferentes se siembran las dos semillas:
1 2 3 4 5
HIBRIDO 90 85 95 76 80
1
HIBRIDO 97 82 102 94 78
2
148
¿Cuál es la probabilidad de que con el nuevo híbrido la producción media sea
15Tm. mayor que la antigua?
149
Para poblaciones finitas en las que el muestreo es sin remplazamiento, la segunda
ecuación en (9) se remplaza por αx́ como se da por (6) con ,α ¿ √ pq .
Nótese que las ecuaciones (9) se obtienen mucho más fácilmente al dividir por n la
media y la desviación típica (np y √ npq )de la distribución binomial.
4.2.4 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS
PROPORCIONES
(11)
Utilizando (4) y (5). Este resultado también es válido para poblaciones finitas si el
muestreo es con remplazamiento. La variable tipificada
(12)
150
En tal caso tiene casi una distribución normal si n 1 y n2 son grandes (n1, n2 ≥30).
Resultados semejantes pueden obtenerse para poblaciones finitas en las que el
muestreo es sin remplazamiento (4) y (6)
Resultados correspondientes pueden obtenerse para distribuciones muestrales de
diferencias de proporciones de dos poblaciones distribuidas binomialmente con
parámetros p1,q1 y p2 y q2 respectivamente . En este caso S1 y S2 corresponden a
las proporciones de éxitos P1 y P2 y las ecuaciones (11) resultan
(13)
151
4.3 TEOREMA DEL LIMITE CENTRAL
152
Si la población tiene una distribución de probabilidad normal, entonces, para
cualquier tamaño de muestra la distribución del muestreo de la media también
tendrá una distribución normal. Si la distribución de la población es simétrica (pero
no normal), se verá que surge la forma normal como lo establece el teorema del
límite central aún con muestras tan pequeñas como tamaño 10. Por otra parte, si
se toma una distribución que esté sesgada o tenga extremos muy gruesos, quizá
requiera muestras de al menos 30 para observar las características de normalidad.
La mayoría de los estadísticos coincidirán que una muestra de 30 es lo bastante
grande para poder emplear el teorema del límite central.
La idea de que la distribución de medias de muestras de una población que no sea
normal convergerá a la normalidad se ilustra en los diagramas 7-2, 7-3 y 7-4. Este
ejemplo se analizará con mayor detalle dentro de poco, pero el diagrama 7-2 es
una gráfica de una distribución de probabilidad discreta que tiene el sesgo
positivo. Existen muchas muestras posibles de 5 que podrían seleccionarse de
esta población. Suponga que seleccionan al azar 10 muestras de cinco artículos
cada una y se calcula la media de cada muestra. Estos resultados se ilustran en el
diagrama 7-3. Observe que la forma de la distribución de las medias de la muestra
cambio de la población original aunque sólo se hubieran seleccionado 10 de las
muchas muestras posibles. Dicho de otra manera, se seleccionaron 10 muestras
aleatorias de 5 integrales cada una, de una población que tiene un sesgo positivo
y se descubrió que la distribución de las medias de la muestra ha cambiado de la
forma de la población. A medida que se tomen más muestras, se descubrirá que la
distribución de las medias de la muestra se acercará a la distribución normal. El
diagrama 7-4 es un histograma que muestra los resultados de 30 muestras
aleatorias de 5 observaciones de la misma población. Observe la clara tendencia
hacia una distribución normal. Esto es lo que establece el teorema del límite
central. El ejemplo siguiente hará resaltar esa condición.
153
Diagrama 7-4: Histograma de la antigüedad media de servicio para 30
muestras de empleados de SpenceSprockets, Inc.
Ejemplo:
Ed Spence comenzó su empresa de engranes hace 20 años. Con el paso del
tiempo, la empresa creció y hoy en día emplea a 40 personas. SpenceSprockets,
Inc, enfrenta algunas importantes decisiones respecto a la salud de estos
empleados. Antes de tomar una decisión sobre el plan que debería adquirir, Ed
decide formar un comité de 5 representantes de los empleados. Se pedirá a
comité que estudie con cuidado la cuestión del plan de salud y haga una
recomendación sobre el plan que mejor se ajuste a las necesidades de los
empleados. Ed siente que las opiniones de los empleados más jóvenes hacia el
cuidado de su salud pueden diferir de los empleados de mayor edad. Si Ed
selecciona al azar su comité, ¿Qué puede esperar en cuanto a la media de años
de servicio de SpenceSprockets para los integrantes del comité? ¿De qué manera
la forma de la distribución de los años de antigüedad de todos los empleados se
compara con la forma de distribución de muestreo de la media? Los años de
servicio (redondeados a años completos) de los 40 empleados de hoy en día
están en la nómina de SpenceSprockets, Inc., son como sigue:
11 4 18 2 1 2 0 2 2
4
3 4 1 2 2 3 3 19 8 3
7 1 0 2 7 0 4 5 1
14
16 8 9 1 1 2 5 10 2 3
Solución
En un diagrama ilustra la distribución de los años de experiencia de los 40
empleados actuales. Observe que la distribución de los años de servicio tiene un
sesgo positivo. Existen algunos empleados que han trabajado en
154
SpenceSprockets durante cierto tiempo. Específicamente, seis empleados han
trabajado en la empresa diez años más. Sim embargo, debido a que la empresa
ha crecido, el número de empleados se ha elevado en los últimos años. De los 40
empleados, 18 han estado en la empresa por 2 años o menos.
Hay que considerar el primero de los problemas de Ed Spence. Quiere formar un
comité de cinco miembros para analizar la cuestión del cuidado de la salud y
sugerir el tipo de seguro que sería el más apropiado para la mayoría de los
trabajadores. ¿Cómo debería seleccionar el comité?
Para comenzar Ed anota los años de servicio de los 40 en un papel y los poner en
una vieja gorra de beisbol. A continuación, resuelve los papeles y toma al azar
cinco de ellos. Los años de servicio de estos 5 empleados son: 4, 1, 0, 14 y 19.
Así, la antigüedad media para estos cinco empleados es 5.60 años. ¿Cómo se
compara con la media de la población? En este momento Ed no conoce la media
de la población, pero el número de empleados es de sólo 40, de modo que decide
calcular la antigüedad media de servicio para todos los empleados. Es 4.80 años,
que se encuentra sumando los años de servicio para todos los empleados y
dividiendo el total entre 40. Es decir µ= (11+4+18+…+2+3)/40=192/40=4.80. La
diferencia de la media de la muestra, X y la media de la población, µ, es el error de
muestreo. En otras palabras, la diferencia de 0.80 años entre la media de la
población y la media de la muestra de 5.60, es el error de muestreo. Esto se debe
al azar. Así, si Ed hubiera seleccionado a 5 empleados para formar el comité, la
antigüedad media del servicio sería un poco mayor a la media de la población.
¿Qué ocurría si Ed devolviera los 5 trozos de papel a la gorra de beisbol y
seleccionara otra muestra? ¿Esperaría usted que la media de esta segunda
muestra fuera exactamente la misma que la anterior? Suponga que Ed toma otra
muestra de 5 empleados y descubre que las antigüedades de servicio de esa
muestra son 8, 3, 11 y 14. La media de esta muestra es de 5.40 años. El resultado
de seleccionar 10 muestras, de 5 empleados cada una, se ilustra en el diagrama
pasado. Vea la diferencia de la forma de la población y la distribución de las
medias de la muestra. La población de antigüedades de servicio para los
empleados tiene un sesgo positivo pero la distribución de estas 10 medias no
refleja el mismo sesgo positivo. De hecho, tiene uno negativo.
La ilustración 7-5 muestra los resultados de seleccionar 30 muestras de más de 5
empleados cada una, y calcular las medias de estas muestras. Estas medias de
muestra se organizar entonces en un histograma (diagrama 7-4). Compare la
forma de este polígono de frecuencia con la población de empleados del diagrama
7-2. Es preciso que observe dos importantes características:
1. La forma de la distribución de 30 muestras es diferente de la población. En
el diagrama 7-2, la distribución de todos los empleados tienen un sesgo
positivo. Sin embargo, la distribución muestral de las medias de muestras,
diagrama 7-4, está más próxima a una distribución normal. Esto ilustra el
teorema del límite central.
155
Ilustración 7-5: Muestras aleatorias y medias de muestra de 30 muestras de cinco
empleados de SpenceSprockets, Inc.
2. Existe menos dispersión en la distribución muestral de las medias de
muestras que en la distribución de la población. En la población, la
antigüedad de servicio iba de 0 a 19 años. En la distribución muestral de
medias de muestras, estas últimas iban de 2.2 sólo 9.2 años.
156
También es posible comparar la media de las medias demuestras con la media
de la población. La media de las 30 muestras se presentaron en la ilustración
7-5 es 4.7133 años, que se encuentra mediante µ x=(5.6+5.4+…9.2+7.0)/30.
Se usa el símbolo µ x la media de las medias de muestra. El subíndice se
recuerda que se trata de una distribución de medias de muestras. Se lee “mu
subíndice x con barra”. Se observa que la media de medias de muestras,
4.7133 años, es muy próxima a la media de población de 4.80 años.
¿Qué se puede concluir de este ejemplo? El teorema de límite central indica
que, independientemente de la forma de población, la forma muestral de las
medias de muestra se aproximará a la distribución normal. Mientras mayores
sean las muestras, mayor será la convergencia. SpenceSprockets, Inc, es una
evidencia empírica del funcionamiento del teorema del límite central. Esta
ilustración comienza con una población con sesgo positivo. A continuación, se
eligió un pequeño número de muestras y se observó una distribución de
medias de muestra. Se podría observar un cambio en la forma de la población
para la distribución de medias de muestra. Cuando se aumenta el número de
muestras de 10 a 30, se comienza a ver la característica de la normalidad. La
forma de la distribución de 30 medias de muestra que se representaron en el
diagrama 7-4 claramente tiende hacia a una distribución normal a medida que
aumenta el tamaño de la muestra.
El teorema del límite central no dice nada de la dispersión de la distribución de
medias de muestras, con la medida de la población. Sin embargo, en el
ejemplo-solución, se observó que hay menos dispersión en la distribución de
medias de muestra que en la población al comparar el rango de la población y
el de las medias de muestra. También se observó que en la media de todas las
medias de muestra estuvo muy cerca de las medias de población.
Es posible demostrar que si la dispersión en la población es σ, la dispersión en
las medias de la muestra es σ/ √ n , donde n es el tamaño de la muestra. Con
base en esta relación, es posible ver que, a medida que aumenta el tamaño de
la muestra disminuye la dispersión de las medias de las muestras. También es
posible demostrar que la media de la población es exactamente igual a la
medida de todas las medias de las muestras. Dicho de otra forma, la media de
todas las medias es igual a la media de la población.
El teorema del límite central: un segundo ejemplo.
Ejemplo
El ejemplo anterior proporciona cierta idea de la importancia del teorema del
límite central. No obstante, vale la pena considerar otro ejemplo. En este
segundo ejemplo se observa al teorema del límite central en un entorno
clásico.
Suponga que se tiene un dado no cargado, lánzalo dos veces y observe el
número de puntos. Así, el primer lanzamiento da 3 y el segundo da un 4, lo que
interesa es el total de puntos, es decir, 7. ¿Cuál es la forma de la población del
157
número de puntos? ¿Cuáles son los resultados posibles de este experimento?
¿Cuál es la forma de la distribución de la suma del número de puntos cuando
un solo dado se lanza dos veces?
Solución
En realidad, se trata de una situación de muestreo. La población es una
distribución uniforme, y cada uno de los números enteros de 1 al 6 tiene la
misma probabilidad de ocurrencia. El cuatro y los diagramas siguientes ilustran
los diversos resultados en la población y sus probabilidades correspondientes.
158
Por ejemplo, si el primer lanzamiento del dado es 4 y el segundo 6, el total es
10. A continuación, se desea una distribución del número total del resultado de
puntos que aparecen. Con base en el cuadro, existen 36 resultados posibles, y
sólo un resultado en el número total de puntos que aparecen es 2, al igual que
en el caso que el total es 12. Existen tres casos en el que el total es 4, 6
ocasiones en el que el total es 7, y así sucesivamente. Para este momento
usted quizás habrá observado que es posible encontrar el número de
resultados al observar las diagonales de la esquina superior izquierda a la
inferior derecha. El número total de puntos y la probabilidad de cada una de
ellas se resumen en la ilustración y el diagrama siguiente:
159
observe los efectos claros del teorema del límite central. Cuando es posible
moverse de uno a dos y luego tres lanzamientos del dado, la forma de la
distribución cambia y se mueve hacia una forma de campana, la distribución de
probabilidad normal: un resultado interesante que intrigo a los matemáticos del
siglo XVll y que ha tenido como resultado muchas aplicaciones modernas.
AUTOEVALUACIÓN 2-3
Retome los dados de SpenceSprockets, Inc. Seleccione 10 muestras aleatorias
de 5 empleados cada una. Use los métodos descritos en este capítulo y la
tabla de números aleatorios (apéndice E) para encontrar a los empleados que
se han de incluir en las muestras. Calcule las medias de cada muestra y trace
las medias de las muestras en un diagrama similar al 7-3.
Diagrama 7-5: Suma de puntos que aparecen en uno, dos y tres lanzamientos
de un dado normal.
Ejercicios
1.- El apéndice E es una tabla de números aleatorios. En él, cada número
entero de 0 a 9 tiene la misma probabilidad de ocurrencia.
a) Trace una gráfica que muestre la distribución de la población. ¿Cuál es
la media de la población?
b) A continuación se encuentran las primeras 10 filas de cinco dígitos de
apéndice E. Suponga que se trata de 10 muestras aleatorias de cinco
valores cada una. Determine las medias de cada muestra y trace las
medias en un diagrama similar al 7-3. Compare la media de la
distribución muestral de las medias de muestras contra la media de
población.
160
2.- Scrapper Elevator Company tiene 20 representantes de venta que venden
el producto en todo el territorio de Estados Unidos y de Canadá. El número de
unidades que el último mes vendió cada uno de los representantes aparece a
continuación. Suponga que estas cifras de ventas son valores de la población.
2 3 2 3 3 4 2 4 3 2 2 7 3 4 5 3 3 3 3 5
161
estéreo. Seleccionan una muestra aleatoria de 50 compradores recientes,
determinan la edad de cada uno de ellos en la muestra, y calculan la edad media
de los compradores en la muestra. La media de las muestras es un estimador
puntual de la media de la población.
No obstante, un estimador puntual solo refiere una parte de la historia. Si bien se
espera que el estimador puntual esté próximo al parámetro de la población, se
desearía expresar qué tan cerca está. Un intervalo de confianza sirve a este
propósito.
4.5 DETERMINACION DEL TAMAÑO DE LA MUESTRA DE UNA POBLACION
162
Cálculo del tamaño de la muestra desconociendo el tamaño de la población
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
Cálculo del tamaño de la muestra conociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la
población es la siguiente:
En donde,
N = tamaño de la población
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).
163
4.6 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA
DISTRIBUCIÓN
se distribuye según una Normal estándar. Por tanto, aplicando el método del
pivote podemos construir la expresión
164
se distribuye según una t de Student de n − 1 grados de libertad. Por tanto, y
siguiendo pasos similares a los del apartado anterior, el intervalo de confianza
resultante es
165
BIBLIOGRAFÍA
1. Berenson, M. (2006). Estadistica para administración. (4°. Ed.) México: Pearson
Educación.
2. Carot, V. (2006). Control estadístico de la calidad. España: Alfaomega.
3. Devore, J. L. (2012). Probabilidad y estadística para ingenierias y ciencia. (8°. Ed.)
México: Cengage Learning.
4. Gamiz, B. E. (2012). Probabilidad y estadística con prácticas en Excel. (3°. Ed.).
México: JIT Press.
5. Gutiérrez, P. H. (2012). Análisis y diseño de experimentos. (3°. Ed.). México: McGraw-
Hill
6. Gutiérrez, P. H. (2009). Control estadístico de calidad y seis sigma. (2°. Ed.). México:
McGraw-Hill
7. Hines, W. (2009). Probabilidad y estadística para ingeniería. (4°. Ed.) México: CECSA:
Grupo Editorial Patria
8. Johnson, R. A. (2012), probabilidad y estadística para ingenieros. (8°. Ed.). México:
Pearson Educación
9. Kazier, L. (2006). Estadística aplicada a administración y economía. (4°. Ed.). México:
McGraw-Hill
10. Larson, H.J. (1992). Introducción a la teoría de probabilidad e inferencia estadística.
México: Limusa
11. Levine, D. M. (2010). Estadística para administración y economía. (7°. Ed.). México:
Pearson Educación
12. Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13°. Ed.).
México: Cengage Learning
13. Montogomery, D. C. (2011). Probabilidad y Estadística aplicados a la Ingeniería. (2°.
Ed.). México: Limusa: Wiley
14. Quezada, L. (2010). Estadística para ingenieros. México: Empresa Editora Macro
15. Remes O. Antonio J. (2012). Estadística inferencial I y II. (3°. Ed.). talleres I.T.V.
16. Rodríguez, F. J. (2008). Estadística para administración. México: Grupo Editorial
Patria
17. Spiegel, M. (2010). Fórmulas y tablas de matemáticas aplicada. (3°. Ed.). México:
McGraw-Hill
18. Spiegel, M. (2010). Teoría y problemas de Probabilidad y Estadística. (3°. Ed.).
México: McGraw-Hill
19. Wackerly, D. D. (2010). Estadística matemática con aplicaciones. (7°. Ed.). México:
Cengage Learning
20. Walpole, R. E. (2012). Probabilidad y estadística para ingeniería y ciencias. (9°. Ed.).
México: Pearson Educación
166