Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual 2014 I 03 Analisis Probabilistico 1351 PDF
Manual 2014 I 03 Analisis Probabilistico 1351 PDF
Probabilístico
2
ÍNDICE
Presentación 5
Red de contenidos 6
Análisis de correlación 84
Ejemplo de Aplicación 85
Análisis de Regresión con Excel 87
Ejercicios Propuestos 90
Presentación
En la primera parte del curso, se exponen las herramientas metodológicas para el análisis
de cuadros estadísticos. La segunda parte comprende la aplicación de la teoría de
probabilidades y de los modelos de distribución probabilística. Finalmente, en la tercera
etapa, se desarrollan modelos predictivos de regresión lineal simple que permiten contar con
una herramienta, estadísticamente confiable, para la toma de decisiones.
En las sesiones de clase, el curso se desarrolla en forma teórico – práctica; por lo que las
mismas tendrán exposiciones dialogadas sobre los fundamentos de los temas que se
tratarán y la resolución de ejercicios, dándole mayor énfasis a esta última parte y al análisis
e interpretación de resultados.
Red de Contenidos
Estadística I
Estadística Regresión y
Probabilidad
Descriptiva Correlación
Muestras
Regresión
Correlación
Lineal Simple
Tablas Análisis
Probabilidades
Tendencias Posición y
Centrales Dispersión
1. RECOPILAR 2. ORGANIZAR
3. PRESENTAR 4. ANALIZAR
UNIDAD DE APRENDIZAJE
ESTADÍSTICA DESCRIPTIVA
TEMARIO
La Estadística
Población y muestra
Medidas de posición
Medidas de dispersión
ACTIVIDADES PROPUESTAS
1. LA ESTADÍSTICA
Estadística Descriptiva
Estadística Inferencial
2. POBLACIÓN Y MUESTRA
3. VARIABLES
Son aquellas variables que indican alguna cualidad, atributo o categoría del
elemento estudiado. Se caracterizan porque por sí mismos no proporcionan
valores numéricos.
Las variables cualitativas se denominan ORDINALES cuando los datos
proporcionados por la variable son susceptibles de ser ordenados a través de una
jerarquía.
Las variables cualitativas se denominan NOMINALES cuando no es posible
ordenar los datos bajo una determinada regla.
Cuando los datos son recolectados, estos se deben ordenar y clasificar. Para realizar
esta tarea, los datos se pueden clasificar utilizando cuadros estadísticos y gráficos
estadísticos.
EJEMPLO:
A continuación, se muestra el número de hijos de 36 familias de Lima:
2 3 4 5 1 2 3 2 1
0 2 1 5 3 1 2 3 2
2 4 3 5 2 0 2 1 3
1 1 4 2 3 4 5 1 0
SOLUCIÓN:
La variable de estudio (X) es el número de hijos de 36 familiares. Luego,
construyendo la Tabla de Distribución de Frecuencias, se tiene lo siguiente:
X fi Fi hi Hi
0 3 3 0,0833 0,0833
1 8 11 0,2222 0,3055
2 10 21 0,2778 0,5833
3 7 28 0,1944 0,7777
4 4 32 0,1111 0,8888
5 4 36 0,1111 0,9999
36 ≈1
g) Las frecuencias absolutas acumuladas (Fi), así como las frecuencias relativas
(hi y Hi) se hallan de la misma forma que para una distribución de frecuencias
de variables cuantitativas discretas.
EJEMPLO:
Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen:
33 50 61 69 80 35 52 64 71 81
35 53 65 73 84 39 54 65 73 85
41 55 65 74 85 41 55 66 74 88
42 57 66 76 89 45 59 66 77 91
47 48 60 68 78 97 60 67 77 94
SOLUCIÓN:
Aplicando la Regla de Sturges, encontramos que K ≥ 6,61 → K = 7
El rango de los datos está dado por R = 97 – 33 = 64
Luego, la amplitud de los intervalos está dado por A = (64/7) = 9,143
Intervalos mi fi Fi hi Hi
[ 33 – 42,143 > 37,5715 7 7 0,14 0,14
[ 42,143 – 51,286 > 46,7145 4 11 0,08 0,22
[ 51,286 – 60,429 > 55,8575 9 20 0,18 0,40
[ 60,429 – 69,572 > 65,0005 11 31 0,22 0,62
[ 69,572 – 78,715 > 74,1435 9 40 0,18 0,80
[ 78,715 – 87,858 > 83,2865 5 45 0,10 0,90
[ 87,858 – 97 ] 92,4295 5 50 0,10 1
Total 50 XXX 1 XXX
Cada uno de los datos de la tabla permite obtener cierta información, dependiendo de
su ubicación.
f5: Existen 16 trabajadores cuyo sueldo está entre los 58 y 66 soles diarios
f5: Existen 16 trabajadores cuyo sueldo promedio es de 62 soles diarios
F3: Hay 7 trabajadores que tienen un sueldo promedio menor o igual a 46 soles
F3: Existen 38 trabajadores cuyo sueldo es mayor a 46 soles en promedio
h2: El 4,4% de los trabajadores tiene un sueldo promedio de 38 soles diarios
h4: El 22,2% de los trabajadores tiene un sueldo que oscila entre 50 y 58 soles
H6: El 91% de los trabajadores tiene un sueldo menor a 74 soles diarios
H6: El 9% de los trabajadores gana de 74 soles diarios a más.
Los valores determinados como medidas de tendencia central son aquellos valores que
se toman como referencia para señalar y/o analizar el comportamiento de un conjunto
de datos. Estos valores tienen por objetivo reemplazar a todo un conjunto de datos
dentro de los análisis y cálculos estadísticos. Los más utilizados son la Media
Aritmética, la Mediana y la Moda
todos los valores de las observaciones estuviera dividida en partes iguales entre
todos los elementos de la muestra.
El cálculo de la Media Aritmética se muestra en el siguiente cuadro:
X
x .f i i
X
m .f i i
X
xi n n
n
X x .h i i
X m .h i i
5.2. Mediana
n / 2 Fj 1
Me L j A j
fj
5.3. Moda
f j f j 1
Mo L j A j
( f j f j 1) ( f j f j 1)
Donde: Lj :
Límite inferior del intervalo modal
fj :
Frecuencia absoluta del intervalo modal
fj – 1 : Frecuencia absoluta del intervalo anterior al intervalo modal
fj + 1 : Frecuencia absoluta del intervalo siguiente al intervalo modal
EJEMPLO DE APLICACIÓN
Los datos que a continuación se muestran son las edades de las personas que han
acudido a un policlínico solicitando exámenes de despistaje de cáncer.
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
SOLUCIÓN:
Intervalos mi fi Fi hi Hi
[ 26 – 34 > 30 1 1 0,022 0,022
[ 34 – 42 > 38 2 3 0,044 0,066
[ 42 – 50 > 46 4 7 0,089 0,154
[ 50 – 58 > 54 10 17 0,222 0,376
[ 58 – 66 > 62 16 33 0,356 0,732
[ 66 – 74 > 70 8 41 0,178 0,910
[ 74 – 82 > 78 3 44 0,067 0,977
[ 82 – 90 ] 86 1 45 0,022 1
Total 45 1
45 / 2 17
Me 58 8 60,750
16
Este resultado indica que el 50% de las personas acuden a solicitar exámenes de
despistaje de cáncer es de 60,7 a menos.
c) Para la Moda, observamos que esta se encuentra en el quinto intervalo, por lo que
el cálculo es el siguiente:
16 10
Mo 58 8 61,429
(16 10) (16 8)
Este resultado indica que la frecuencia con que más solicitan exámenes de
despistaje de cáncer es 61 personas.
6. MEDIDAS DE POSICIÓN
n k
PK LPk A
100
Fj 1
fj
Donde: LPk : Límite inferior del intervalo que contiene a Pk
fi : Frecuencia absoluta del intervalo que contiene a Pk
Fi-1 : Frecuencia acumulada absoluta del intervalo inmediatamente anterior
al intervalo que contiene a Pk
A : Amplitud del intervalo
Se denomina CUARTIL a cada uno de los tres percentiles P25, P50, P75. El cuartil uno
(denotado por Q1) es igual a P25; el cuartil dos (denotado por Q2) es igual al percentil
P50 (que es la mediana); y el cuartil tres (denotado por Q3) es igual al percentil P75.
Se denomina DECIL a cada uno de los nueve percentiles P10, P20, P30, P40, P50, P60,
P70, P80, P90 que dividen a todo el conjunto de datos en 10 partes iguales.
Para los 45 ingresos (en dólares) quincenales por horas extras tabulados en la
distribución de frecuencias de 8 intervalos, los datos recopilados fueron los siguientes:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
SOLUCIÓN:
Intervalos mi fi Fi hi Hi
[ 26 – 34 > 30 1 1 0,022 0,022
[ 34 – 42 > 38 2 3 0,044 0,066
[ 42 – 50 > 46 4 7 0,089 0,154
[ 50 – 58 > 54 10 17 0,222 0,376
[ 58 – 66 > 62 16 33 0,356 0,732
[ 66 – 74 > 70 8 41 0,178 0,910
[ 74 – 82 > 78 3 44 0,067 0,977
[ 82 – 90 ] 86 1 45 0,022 1
Total 45 ---- 1 ----
42 8
45 10
100
3
a) P10
4 45
Este resultado indica que hay un 10% de personas que perciben un ingreso
quincenal por horas extras de 45 dólares o menos.
45 25
100
7
b) P25 50 8 53,4
10
Este resultado indica que hay un 25% de personas que perciben un ingreso
quincenal por horas extras de hasta 53,4 dólares
58 8
45 50
100
17
c) P50
16 60,75
Este resultado indica que hay un 50% de personas que perciben un ingreso
quincenal por horas extras de 0,75 dólares o menos.
66 8
45 75
100
33
d) P75
8 66,75
Este resultado indica que hay un 75% de personas que perciben un ingreso
quincenal por horas extras de 66,75 dólares o menos. También puede indicar
que hay un 25% de personas que ganan más de 66,75 dólares por ingresos
quincenales en horas extras.
45 90
100
33
e) P90 66 8 73,5
8
Este resultado indica que hay un 90% de personas que perciben un ingreso
quincenal por horas extras de 73,5 dólares o menos. También puede indicar
que hay un 10% de personas que ganan más de 73,5 dólares por ingresos
quincenales en horas extras.
X X .f nX m .f nX
2 2 2
n X
2 2 2
V i
V i i
V i i
n* n* n*
S V
7.3. Coeficiente de Variación
S
CV x100
X
CIBERTEC CARRERAS PROFESIONALES
22
Si en una empresa A de 100 trabajadores el sueldo promedio es 500 soles, con una
varianza de 900 soles, y en la empresa B el coeficiente de variación de los sueldos es
del 5.6%, ¿qué podría afirmar acerca de la dispersión de los sueldos de las empresas A
y B?
SOLUCIÓN:
Como se trata de dos poblaciones diferentes, entonces requerimos el coeficiente de
variación para poder compararlas.
30
Entonces: CV x100 6%
500
Para la empresa B: CV 5,6%
Por lo tanto, podemos afirmar que, en la empresa A, los sueldos son más dispersos que
en la empresa B. Igualmente, podemos afirmar que en la empresa B los sueldos son
más homogéneos que en la empresa A.
El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and whisker
plot, es decir, diagrama de caja y bigote.
1. Límite superior: Es el extremo superior del bigote. Las opiniones por encima de
este límite se consideran atípicas.
2. Tercer cuartil (Q3): Es el percentil 75. Por debajo de este valor se encentran como
máximo el 75% de las opiniones de los estudiantes.
3. Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes
iguales. De este modo, 50% de las observaciones están por debajo de la mediana y
50% está por encima (es el percentil 50).
4. Primer cuartil (Q1): Es el percentil 25. Por debajo de este valor se encuentra como
máximo el 25% de las opiniones de los estudiantes.
5. Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este
valor se consideran atípicas.
6. Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos.
Pueden representar efectos de causas extrañas, opiniones extremas o en el caso
de la tabulación manual, errores de medición o registro.
Se colocan en la gráfica con asteriscos (*) o puntos (.) según se alejan menos o
más del conjunto de datos.
7. Media aritmética: Originalmente no forma parte del boxplot, sin embargo, se suele
considerar su inclusión para dar una idea del valor general representativo.
Para la determinación de los valores característicos del diagrama, se deben tomar las
siguientes consideraciones:
Rango Intercuartílico = Q3 – Q1
Límite interior inferior = Límite del bigote inferior = Q1 - 1,5RI
Límite interior superior = Límite del bigote superior = Q3 + 1,5RI
Límite exterior inferior = Q1 - 3RI
Límite exterior superior = Q3 + 3RI
Los límites interiores son barreras hasta las cuales se “permiten” datos de la muestra
(en la gráfica son los puntos 1 y 5), por estar muy cerca del resto. Estos son los límites
que definen los extremos de los bigotes. De sobrepasar esta barrera se le considera
valor atípico.
Los límites exteriores indican cuándo un dato se aleja en exceso del resto y, siendo
también atípico, se le considera fuera del límite exterior permitido y se dice que es aún
más atípico.
- Mientras más larga la caja y los bigotes, más dispersa es la distribución de datos.
- La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media
aritmética) puede variar, sin embargo, hay que recordar que la cantidad de
elementos entre una y otra es aproximadamente la misma. Entre el límite inferior y
Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de ésta a Q3 y de Q3 al
límite superior. Se considera aproximado porque pudiera haber valores atípicos, en
cuyo caso la cantidad de elementos se ve levemente modificada.
- La línea que representa la mediana indica la simetría. Si está relativamente en el
centro de la caja la distribución es simétrica. Si por el contrario se acerca al primer o
tercer cuartil, la distribución pudiera ser sesgada a la derecha (asimétrica positiva) o
sesgada a la izquierda (asimétrica negativa respectivamente. Esto suele suceder
cuando las opiniones de los estudiantes tienden a concentrase más hacia un punto
de la escala.
- La mediana puede inclusive coincidir con los cuartiles o con los límites de los
bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto.
Pudiera ser este un caso particular de una distribución sesgada o el caso de una
distribución muy homogénea.
En el software Microsoft Excel se tienen herramientas para poder calcular todos los
estadísticos estudiados. Aquí mostraremos un conjunto de pantallas con su respectiva
explicación, que permitirá mostrar cómo se realiza este proceso.
Menú Archivo
Variables
Datos
Cuando seleccionamos el menú archivo, nos aparecerá la siguiente pantalla. Luego nos
dirigimos a la pestaña “Opciones”
Pestaña Opciones
1 2
1 2
3 4
1 3
Finalmente, obtendremos los resultados de los estadísticos descriptivos para cada una
de las variables analizadas.
Queda como ejercicio para cada alumno investigar con mayor detalle, el significado de
los estadísticos: Error típico, Curtosis y Coeficiente de Asimetría.
Actividades propuestas
A.- Conceptos básicos de estadística
4. Una popular cadena de comida peruana “Pacha Mama” ubicada en 10 estados del sur
de Estados Unidos, con un total de 356 establecimientos; recientemente ha
experimentado un marcado cambio en sus ventas, como consecuencia de una campaña
publicitaria bastante exitosa. Para saber con certeza cuál de los cambios realizados
influyen en los incrementos de sus ventas, contrata los servicios de una empresa de
estudios de mercado que toma una muestra de 60 establecimientos y encuentra los
siguientes resultados:
- El 98.5% asegura que la sazón del pukapicante ha mejorado.
- El 60% afirma que la atención es más rápida en el pedido de los juanes.
- El 95% cambió la entrada por ceviche.
- Al 5% no le agrada los picantes mexicanos.
- El 100% consume picantes peruanos.
- El 96% de las personas consume lomo saltado a pesar que su precio se incrementó
en $5.00.
- El promedio de consumo personal en estos establecimientos fue de $82.00.
De acuerdo a los datos anteriores determine la población, la muestra y las variables con
sus respectivos tipos y además indique el tipo de estimación utilizada.
5. Aceros Arequipa ha estado buscando los factores que influyen en las ventas de varas
de acero (en millones de toneladas) que realiza en la ciudad de Lima. Tomo una
muestra de 300 establecimientos en diferentes partes de Lima y Callao y después de
realizar un estudio de mercado, la administración de la empresa obtuvo los siguientes
resultados:
- Del total de encuestados el 27% dejo de comprar dicho producto.
- El 90% de encuestados afirman que el producto mantiene su calidad.
- El 32% no consume solamente el producto.
- El 56% afirma que el producto se encuentra escaso en el mercado, y de los que
afirman esto el 84% compran otro producto.
- El 95% de los consumidores paga por las varillas de ½ pulgadas entre $ 6.20 y $
7.05 dólares.
- Además se encontró que el precio fijado en la ciudad de Lima de $ 6.10 no se
respeta, y por esta razón, existe un desabastecimiento del 90% en la ciudad del
Callao.
De acuerdo a los datos anteriores determine la población, la muestra y las variables con
sus respectivos tipos y además indique el tipo de estimación utilizada.
8. La empresa XYZ realizó un estudio en la ciudad de Lima sobre las principales marcas
de cerveza vendidas por el consorcio ABC, compuesto por los supermercados S y W. El
estudio se realizó en Julio del 2012 y se entrevistaron a un total de 1200 consumidores
elegidos al azar, 500 en el supermercado S y 700 en el supermercado W. Algunas de
las informaciones se proporcionan a continuación:
Las marcas de cerveza que se vendieron en el mes de agosto en estos
supermercados fueron Cristal, Pilsen, Cuzqueña, y Bremen.
El 30% de los consumidores son de condición media alta.
Tres personas que consumen no tienen preferencia por una marca en particular.
El 10% consume sólo la marca Bremen.
El 15% de los que prefieren Pilsen viven en el Callao o en zonas aledañas.
El 45% afirmó no tener problemas en consumir cualquier marca de cerveza.
Uno de los entrevistados pertenece a la clase media baja y prefiere cerveza en lata.
Doscientos consumidores del mercado S y 80 del supermercado W afirmaron que la
cerveza en lata presenta mejor sabor que en Six pack y que en envase retornable.
Uno de los objetivos del estudio era estimar la verdadera cantidad de dinero
promedio que los consumidores gastan mensualmente en cerveza.
De acuerdo con el enunciado identifique la población, la muestra del estudio y las
variables del estudio con su respectiva tipificación. Además indiqué qué otro ítem se
podría considerar como consulta a los entrevistados para mejorar el estudio.
9. La empresa XXX produce, entre otros productos, aceites y mantequilla para consumo
humano. Dicha empresa encargó realizar un estudio sobre las preferencias de las
personas de clase media de la ciudad de Lima acerca de dichos productos. Para el
estudio se tomó una muestra aleatoria de 600 personas, y se obtuvo lo siguiente:
9.1. El 35% de los encuestados prefiere los productos “diet”.
9.2. El 55% de los encuestados prefería los aceites vegetales.
9.3. El 13% de los encuestados no supo diferenciar la mantequilla de la margarina.
9.4. Una persona dijo que no consumía ningún tipo de mantequilla.
De acuerdo con el enunciado identifique la población, la muestra del estudio y las
variables del estudio con su respectiva tipificación. Además indiqué qué otro ítem se
podría considerar como consulta a los entrevistados para mejorar el estudio.
10. Se realizó un estudio en el distrito XXX donde el principal objetivo era establecer la
viabilidad de emprender un negocio de alquiler de computadoras. Era importante
determinar si los habitantes del distrito poseían computadoras personales en casa o
utilizaban las cabinas de Internet. El estudio arrojó, entre otros resultados, lo siguiente:
a) El 80% de los 400 encuestados no poseen computadoras personales.
b) El 20% afirmó que le interesaría alquilar por días alguna computadora personal.
c) El 35% de los habitantes del distrito XXX tienen conocimientos de Microsoft Office.
De acuerdo con el enunciado identifique la población, la muestra del estudio y las
variables del estudio con su respectiva tipificación. Además indiqué qué otro ítem se
podría considerar como consulta a los entrevistados para mejorar el estudio.
11. Una empresa realiza una encuesta sobre el uso de cajeros automáticos en un distrito con
una población de 50000 personas. De las 1200 personas encuestadas se tiene la siguiente
información:
a) El 60% de los habitantes del distrito usa la red de cajeros Unibanca.
b) La edad promedio de los encuestados fue 38 años.
c) El 72% de los usuarios afirmó que únicamente los utiliza para retirar dinero.
d) El 5% de los encuestados afirmó haber sido asaltado al utilizar el cajero.
De acuerdo con el enunciado identifique la población, la muestra del estudio y las
variables del estudio con su respectiva tipificación.
12. Se realizó un estudio para establecer las posibilidades que tenía el candidato X de ganar las
elecciones municipales en el distrito A. Se encuestaron a 200 personas y se obtuvo lo
siguiente:
a) El 40% de los habitantes del distrito X no ha decidido aún su voto.
b) El 23,5% indicó que votaría por el candidato X.
c) El principal problema a resolver por el nuevo alcalde es el de la delincuencia, tal como lo
indicaron el 75% de los encuestados.
d) El 25% de los habitantes del distrito vive hace más de 5 años en dicha zona.
De acuerdo con el enunciado identifique la población, la muestra del estudio y las
variables del estudio con su respectiva tipificación.
2 4 3 1 2 0 4 3 1 2
1 2 3 0 2 0 1 2 3 2
1 2 3 2 1 2 2 4 3 2
21,3 15,8 18,4 22,7 19,6 15,8 26,4 17,3 11,2 23,9
26,8 22.7 18,0 20,5 11,0 18,5 23,0 24,6 20,1 16,2
18,3 21,9 12,3 22,3 13,4 17,9 12,2 13,4 15,1 19,1
4. El consumo mensual de agua (en metros cúbicos) de ochenta familias, se tabuló en una
distribución de frecuencias simétricas de 7 intervalos de amplitud iguales a 3, siendo las
marcas de clase del cuarto intervalo igual 19. Si las frecuencias del primer y tercer
intervalo son iguales al 5% y 15% del total respectivamente, y además, la quinta
frecuencia porcentual acumulada es 85% del total. Reconstruya la distribución.
5. Los puntajes de una prueba de aptitud se tabularon en una distribución de frecuencias
de 6 intervalos de igual amplitud. Se tienen las marcas de clase: m2 = 40 y m4 = 80.
Además, las frecuencias obtenidas fueron: h1 = h6 ; h3 = h5 ; h4 = 0,25; h2 = h4 - h1 ;
h3 = h1 +0,10 y F6 = 60. Complete la distribución de frecuencias.
81 53 67 60 80 64 56 54 91 61
66 88 67 65 97 72 74 65 73 69
43 54 76 70 86 68 82 75 79 60
41 87 76 97 70 45 60 45 65 56
92 72 82 80 52 65 50 58 70 76
8. A continuación se muestran los tiempos (en segundos) que una máquina transportadora se
demora en trasladar 40 paquetes:
44.0 56.8 46.5 48.7 36.3 42.5 32.4 46.6 35.5 39.3
45.3 56.6 43.7 37.6 42.3 45.6 33.5 47.8 32.8 42.6
57.0 43.9 36.8 45.7 34.9 48.6 35.7 43.2 39.1 38.8
440 33.4 35.8 46.0 36.8 32.7 38.2 37.1 45.2 39.2
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 557 432 591 428
440 340 558 460 560 607 382 671 512 492
10. A fin de decidir cuántos mostradores de servicio se necesitarán en las tiendas, una
cadena de supermercados quiso obtener información acerca del tiempo (en minutos)
requerido para atender a los clientes. Se registraron los siguientes tiempos:
12. Ud. realizó un estudio del rendimiento de 20 estudiantes de inglés frente al examen de
suficiencia TOEFL. Las notas que alcanzaron los estudiantes fueron:
4 4 2 5 2 3 5 4 5 4
6 2 3 4 4 5 4 6 5 4
14. La siguiente Tabla muestra la cantidad de hijos que tienen una muestra de 50 pacientes en
edad fértil que han recurrido a la consultoría psicológica para controlar el stress post
operatorio en el Hospital “2 de Mayo” de Lima Metropolitana.
xi fi Fi hi Hi
0 8
1 13
2 0,4
3 7 0,8
4 46
5 0,04
6 1
TOTAL
Puntajes mi fi Fi hi Hi
[ 02 - > 24
[ 05 - > 40%
[ - > 74%
[ - > 60
[ - >
[ - ] 20
Total
16. Ripgam S.A., fabricante de componentes electrónicos desea estudiar las horas de vida
de cierto tipo de batería que fabrica en una de sus líneas de producción. A continuación
se presenta las horas de vida registradas de una muestra aleatoria representativa de 50
baterías de una de sus líneas de producción.
Horas de Vida mi f F hi Hi
[ 115 - > 3
[ - > 130 12
[ - > 0.28
[ - > 17
[ - > 49
[ - ]
Totales
Efectúe un análisis comparativo sobre el tiempo de uso del servicio de Internet de los
estudiantes de ambas facultades. Utilice las medidas estadísticas necesarias.
Intervalos mi fi hi pi Fi Hi Pi
[ - >
[ - 24 > 0.40
[ - > 32 0.80
[ - 42 ]
Total
[ 4 - > 70
[ - >
[ - 22 >
[ - > 450
[ - ]
[ - > 0.25
[ - > 304
[ - > 0.93
[ - ]
[ - > 20 a
[ - > 0.3
[ - > a+0.15
[ - > 127.5
[ - ] 200
Totales
10. La siguiente tabla muestra los resultados de una encuesta de sondeo realizada por un
operador de telefonía celular a los adolescentes de los distritos de Los Olivos y San
Miguel referente al uso del sistema prepago de telefonía celular. El estudio se refirió al
tiempo de uso del sistema telefónico y al gasto de los adolescentes en tarjetas prepago.
a) ¿En cuál de los distritos el gasto de los adolescentes en tarjetas prepago es mayor?
b) ¿En qué distrito el tiempo que los adolescentes hacen uso del sistema de telefonía
celular es menor?
11. El 40% de los sueldos de los empleados de una empresa es mayor o igual a 50 soles
pero menor de 60 soles; el 30% mayor o iguales a 60 soles pero menor de 70 soles; el
15% de los empleados tienen como mínimo sueldos de 70 soles pero menores de 80
soles; y los sueldos del 15% restante son mayores o iguales a 80 soles pero como
máximo 100 soles. Halle la media aritmética de los sueldos de los empleados.
12. El quinto ciclo de una facultad de ingeniería tiene tres secciones. La sección A tiene 45
alumnos y la nota promedio en el curso de matemática fue de 13. La sección B tiene 40
alumnos y la nota promedio en el mismo curso fue de 12. Por último, la sección C tiene
35 alumnos y la media aritmética de las notas en el curso de matemática fue de 15.
Halle el promedio final del quinto ciclo de la mencionada facultad de ingeniería.
13. Una institución educativa tiene 20 profesores. La edad promedio de los profesores
casados, que son 12, es de 36 años. La edad promedio de todos los profesores de la
institución es 30 años. Calcule la edad promedio de los profesores solteros.
Intervalos
mi fi Fi hi Hi
(puntos)
[ 26 – 34 > 30 1 1 0,022 0,022
[ 34 – 42 > 38 2 3 0,044 0,066
[ 42 – 50 > 46 4 7 0,089 0,154
[ 50 – 58 > 54 10 17 0,222 0,376
[ 58 – 66 > 62 16 33 0,356 0,732
[ 66 – 74 > 70 8 41 0,178 0,910
[ 74 – 82 > 78 3 44 0,067 0,977
[ 82 – 90 ] 86 1 45 0,022 1
Total 45 1
Muestra
Vida útil en horas
Empresa A Empresa B
[ 700 900 > 10 3
[ 900 1100 > 16 36
[ 1100 1300 > 26 12
[ 1300 1500 ] 8 3
4. Ud. es contratado por la compañía artística “REQUIEM”, para analizar los costos de los
vestuarios de las dos áreas con que cuenta la compañía:
Música: Formada por 8 músicos cuyos gastos en soles son: 42, 48, 48, 50, 56, 62, 65, 70
Teatro: Formada por 12 actores cuyos consumos se muestran en la siguiente tabla:
6. Clasificaron los sueldos en soles de los obreros de las empresas, obteniéndose los
siguientes resultados:
EMPRESA A EMPRESA B
Sueldos Nro. de Obreros Sueldos Nro. de Obreros
[110 , 120> 20 [105 , 115> 30
[120 , 130> 30 [115 , 125> 50
[130 , 140> 20 [125 , 135> 30
[140 , 150> 10 [135 , 145> 10
10. A continuación se muestra las calificaciones que obtuvieron en dicha evaluación dos
colegios del mismo grado. Colegio A (de Piura) y Colegio B (de Cusco).
Colegio A Colegio B
Promedio 14.36
Mediana 14.75
Varianza 9.6804 8.6904
12. Una ONG dedicada a la investigación de problemas sociales tiene 4 áreas de trabajo:
Contabilidad, Relaciones Internacionales, Proyectos y Proyección Social. Las
remuneraciones mensuales (en nuevos soles) en cada área son las siguientes:
Relaciones Proyección
Contabilidad Proyectos
Internacionales Social
Remuneración Media 1250 1500 1750 1300
Desviación estándar 150 250 100 200
N° empleados 8 5 12 25
13. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variación del
5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada trabajador
del 20% de su sueldo más una bonificación de $60 y el coeficiente de variación baja a
4%. Halle la media y la desviación estándar de los sueldos del mes de agosto. ¿Cuánto
dinero adicional necesita la empresa para pagar todos los sueldos del mes de
septiembre?
14. La distribución de los sueldos (en dólares) de los empleados de dos empresas A y B se
tabuló en 3 intervalos de igual amplitud en cada caso, siendo las frecuencias absolutas
del primero al tercero de 10, 30, 30 y de 30, 50, 20 respectivamente en A y B. Si los
sueldos mínimo y máximo son de 50 y 200 en A y de 60 y 240 en B.
a) ¿En qué empresa los sueldos son más homogéneos?
b) Sí un empleado de A y otro de B ganan cada uno $130. ¿Quién de ellos está mejor
considerado en su centro de trabajo?
16. En una prueba de aptitud mental, la menor y mayor puntación fueron 50 y 200,
respectivamente. Los puntajes (sin decimales) se tabularon en una distribución de
frecuencias simétrica de 5 intervalos de igual amplitud, donde el 20% de los casos son
menores de 95 y el 70% de los casos son menores que 140. Halle el intervalo centrado
en la mediana donde se encuentran el 50% de los puntajes.
17. El consumo mensual de agua (en metros cúbicos) de una muestra de 225 viviendas se
tabuló en una distribución de frecuencias simétrica de cinco de amplitud iguales. Si el
consumo mínimo es de 35 m3, el consumo promedio de 45m3, y si 1/3 de la muestra
consume al menos 43m3 pero menos de 47m3 ¿Qué porcentaje de la muestra consume
al menos 47 m3? ¿Cuántos metros cúbicos como mínimo consumen el 60% de las
viviendas?
18. Una prueba de conocimientos tipo A se calificó sobre 20 puntos dando una media de 12
y una desviación estándar de 2 puntos. mientras que una prueba de aptitud tipo B se
calificó sobre 100 puntos, con una media de 70 y una desviación estándar de 5.
a) ¿En cuál de las dos pruebas los puntajes son más homogéneos?
b) Si Juan tiene 14 en A y Luis 73 en B, ¿quién tiene mejor rendimiento?
19. Un conjunto habitacional está conformado por tres edificios de departamentos. De estos
edificios, se tiene los siguientes datos respecto al consumo mensual de electricidad de
cada uno de los edificios:
Edificio 1 : Tiene 12 departamentos que gastan en promedio 45 soles con una
desviación estándar de 10 soles.
Edificio 2 : Tiene 9 departamentos cuyos consumos en soles son 38, 42, 56, 60,
43, 52, 41, 44, 53.
Edificio 3 : Los consumos se dan en la siguiente tabla:
20. Una empresa de estudios de mercado ha realizado un trabajo, para estudiar, entre otras
variables el pago mensual por alquiler de departamentos (con características similares)
en los distritos A y B. La información recogida fue la siguiente:
Resumen
Una misma variable estadística puede tener distintas clasificaciones: puede ser
cualitativa o cuantitativa.
El promedio es, por lo general, la medida que mejor representa los datos.
Si los datos son muy dispersos o encontramos valores extremos es posible que el
promedio no sea representativo de los mismos. En este caso es mejor utilizar la
mediana.
Las medidas de posición son útiles para establecer valores mínimos o máximos que se
deben lograr como pautas para mejorar el rendimiento de la producción, de las
personas, etc.
Una mayor dispersión de datos implica una menor concentración de los mismos y
viceversa.
Una mayor homogeneidad en los datos equivale a una menor dispersión de los mismos
y viceversa.
Bibliografía
ANDERSON, DAVID R.
2008 Estadística para administración y economía. Editorial Thomson
(519.5 ANDE 2008)
WEIERS, RONALD
2006 Introducción a la estadística para negocios. México, D.F.: Thomson
(519.5 WEIE)
UNIDAD DE APRENDIZAJE
ANÁLISIS PROBABILÍSTICO
TEMARIO
Análisis combinatorio
Probabilidad clásica
Probabilidad condicional
Distribución Binomial
Distribución de Poisson
ACTIVIDADES PROPUESTAS
1. ANÁLISIS COMBINATORIO
2. PERMUTACIONES
n!
Prn
n r !
Algunos ejemplos en los que se aplican las permutaciones son los números que se
pueden formar con 3 cifras; la combinación de colores para hacer una camiseta; las
formas en que se pueden ordenar personas en una fila, etc.
3. COMBINACIONES
El número de combinaciones de “n” elementos tomados de “r” en “r” (sub grupos de “r”
elementos) es:
n!
Cnr
r! n r !
Algunos ejemplos en los que se aplican las combinaciones son el número de apretones
de mano en una reunión; seleccionar a los invitados de una fiesta; seleccionar
preguntas para un examen a partir de un banco de preguntas, seleccionar subgrupos de
personas a partir de un grupo más grande, etc.
4. PROBABILIDAD CLÁSICA
nA
P( A )
nT
0 ≤ P(A) ≤ 1
P(Ω) = 1
P() = 0
P(A’) = 1 – P(A)
P(AUBUC)=P(A)+P(B)+P(C)–P(A∩B)–P(A∩C)– P(B∩C)+P(A∩B∩C)
5. PROBABILIDAD CONDICIONAL
P( A B) n( A B)
P( A / B)
P(B) n(B)
Para resolver las probabilidades condicionales se pueden usar Tablas Cruzadas (para
variables excluyentes) o Diagramas de Venn-Euler (para variables no excluyentes).
Actividades propuestas
A.- Técnicas de Conteo
3. ¿De cuántas formas pueden ordenarse 5 personas en un sofá si tienen solamente tres
asientos?
6. ¿De cuántas maneras se pueden colocar 10 chicas en una fila, de manera que dos
chicas en particular queden juntas?
7. Una persona tiene 15 amigos. ¿De cuántas maneras puede invitar a 6 de ellos si
existen 2 parejas de casados y van siempre juntos a cualquier reunión? Además indicar
de cuántas maneras se pueden invitar a 8 de ellos si existen dos personas que no
deben estar en la misma reunión.
10. Diez amigos se encuentran en una fiesta. ¿Cuántos saludos de mano se intercambian si
cada amigo estrecha la mano a todos los demás sólo una vez?
13. En un ómnibus que posee 37 asientos (en 8 filas de cuatro asientos cada una con un
pasillo en el medio y al final 5 asientos juntos), se desea ubicar 25 pasajeros.
a. ¿De cuántas formas se pueden ubicar?
b. ¿De cuántas formas se pueden ubicar si deciden no ocupar los 5 últimos asientos?
c. ¿De cuántas formas se pueden ubicar los pasajeros si viajan 5 amigos que deciden
ir juntos en los últimos asientos?
d. ¿De cuántas formas se pueden ubicar si ocupan los 18 asientos que poseen
ventanilla?
e. ¿De cuántas formas se pueden ubicar si 10 de los pasajeros están enfermos y
deben viajar en asientos que poseen ventanilla?
15. Cuántos números de 5 dígitos pueden formarse con los 10 dígitos del sistema decimal
si están permitidas las repeticiones.
16. Para la celebración de aniversario del Club Deportivo “LOS EUCALIPTOS”, se desean
formar la mayor cantidad de equipos posibles. Cada equipo deberá confeccionarse una
camiseta con tres franjas horizontales o verticales con los colores del Club (Azul, Verde
y Rojo).
a) ¿Cuántos equipos se pueden formar, para que cada uno tenga una camiseta
diferente?
b) Si se desea que todos los equipos tengan una camiseta con la franja del centro de
color rojo, ¿cuántos equipos se pueden formar?
19. El asta de bandera de un barco tiene tres posiciones en las que se pueden colocar una
bandera en cada una. Si el barco lleva cuatro banderas diferentes para hacer señales.
Cuantas señales diferentes se pueden hacer: Con una bandera; con dos banderas; con
todas las banderas.
21. Un niño tiene 8 bolas blancas y 2 bolas negras y las alinea al azar ¿De cuántas formas
se pueden alinear para que las de color negro queden juntas? ¿De cuántas formas se
pueden alinear para que las de color negro ocupen posiciones de los extremos?
25. ¿Cuántas cantidades diferentes de dinero pueden formarse con; una moneda de 50
céntimos, una moneda de 1 sol, una moneda de 5 soles, un billete de 10 soles, un
billete de 50 soles, y un billete de 100 soles?
5. Una empresa que ofrece servicios de soporte informático cuenta con 5 profesionales
que sólo manejan Visual Basic, 4 manejan sólo Unix y 3 que manejan Windows NT. Una
compañía le solicitó que envíen un equipo de tres personas. Calcule la probabilidad que
el equipo esté formado por las siguientes personas:
a. Una persona que maneje sólo VB, otra Unix y la otra Windows NT.
b. Personas que sólo manejan una sola especialidad.
c. Personas que sólo manejen Windows NT.
6. Una urna A contiene 3 bolas rojas y 3 bolas negras, mientras que la urna B contiene 4
bolas rojas y 6 negras. Si una bola es extraída aleatoriamente de cada urna. ¿Cuál es la
probabilidad de que las bolas sean del mismo color?
9. En una caja, hay 7 bolas rojas y 3 verdes. Se sacan dos bolas al azar de una en una.
Halle la probabilidad de que la primera sea roja y la segunda también si es que no hay
reposición.
11. En una oficina donde se ensamblan computadoras, en una mesa hay 20 chips de los
cuales 6 están malogrados. Primero llega el Sr. Gates y recoge 8 chips y más tarde
llega el Sr. Apple y se lleva los restantes. Halle la probabilidad de que solamente uno de
ellos se haya llevado todos los chips defectuosos.
12. La probabilidad de que Juan asista a una cita es 1/2 y de que María asista a la misma
cita es 5/14. Si la probabilidad de que al menos uno de los dos asista a la cita es 5/7,
calcular la probabilidad de que:
a. Ninguno de los dos asista a la cita.
b. Sólo uno de ellos asista a la cita.
13. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es
0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 0.04.
Calcular la probabilidad de que:
a. Todos los objetos sean no defectuosos.
b. Exactamente un objeto sea defectuoso.
15. Una caja contiene 5 fichas de $10 cada una, 3 de $30 cada una y 2 de $50 cada una.
Si se escogen 3 fichas al azar y a la vez, calcule la probabilidad de que la suma de los
valores sea de $ 70.
18. En una municipalidad hay 5 regidores del partido A, 4 regidores del partido del B y 3
regidores del partido del C. El alcalde de dicha comuna necesita a tres regidores para
auditar los trabajos de alcantarillado que se realizan en una zona del distrito por una
empresa que ganó por licitación y que debe entregar la obra terminada en 30 días a
partir de hoy. El alcalde en forma democrática sortea los nombres de dichos regidores,
pone sus nombres en 12 papeles, y los coloca en una urna.
a. Si saca los papeles uno tras de otro sin reposición, leyendo el nombre de dicho
regidor. ¿Cuál es la probabilidad de que los tres sean del partido A?
b. Si saca los tres papeles a la vez, y lee los tres nombres ¿Cuál es la probabilidad de
que los tres sean de distintos partidos?
19. De 80 personas encuestadas, se encontró que 3/4 son solteras, 3/8 son mujeres y uno
de cada 10 hombres son casados.
a. Si se elige al azar una persona encuestada, halle la probabilidad de que sea
hombre y soltero.
b. Si se eligen al azar dos personas encuestadas, halle la probabilidad de que ambos
sean mujeres y casadas.
21. En una clase de tutoría de Estadística hay 6 varones y 3 mujeres. Si deben elegirse 7
personas.
a. Calcule la probabilidad que en el grupo haya exactamente 5 hombres.
b. Calcule la probabilidad que hayan más hombres que mujeres.
22. Un vendedor tiene 10 autos nuevos de diferentes modelos: 3 del modelo CENIT, 3 del
modelo AZOR y 4 del modelo WAX.
a. ¿Cuál es la probabilidad de vender dos autos del mismo modelo?
b. ¿Cuál es la probabilidad de vender un auto de cada modelo?
23. Un comerciante tiene 15 artículos, de los cuales 5 tienen algún tipo de defecto. Un
cliente pide 3 artículos que no tengan defectos. Si el comerciante escoge al azar y de
una sola vez 5 artículos, ¿cuál es la probabilidad de que con las 5 unidades escogidas
satisfaga el pedido del cliente?
24. En una caja hay 10 chips de los cuales 3 son defectuosos. Se seleccionan 3 chips uno
después de otro (sin reposición), halle la probabilidad que los chips sean defectuosos.
26. Una urna contiene 20 fichas similares de las cuales 10 son rojas, 6 son azules, y 4 son
verdes. Si se extraen 10 fichas al azar y a la vez, calcular la probabilidad de que:
a. Cinco fichas sean rojas.
b. Cinco sean rojas, 3 azules; y 2 sean verdes.
27. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4 tiene algún tipo de
defecto. Un cliente pide para comprar 3 de tales artículos pero que no tengan defectos.
Si el comerciante escoge al azar y de una sola vez 4 de tales artículos, ¿cuál es la
probabilidad de que con las 4 unidades escogidas satisfaga el pedido del cliente?
2. La probabilidad de que Juan asista a una cita es ½ y de que María asista a la misma
cita es 5/14. Si la probabilidad de que al menos uno de los dos asista a la cita es 5/7,
calcula la probabilidad de que:
a. Ninguno de los dos asista a la cita..
b. Solo uno de ellos asista a la cita.
c. Asista María si se sabe que Juan asistió.
d. Asista Juan si se sabe que María no asistió.
3. Una caja contiene 16 pernos de los cuales 8 no tiene defectos, 5 tiene defectos leves, y
3 tiene defectos graves. Si se eligen 3 pernos al azar y de una sola vez, calcular la
probabilidad de que los tres no tengan defectos leves.
5. En una muestra de 240 Loretanos se encontró que el 60% sufre alguna enfermedad, el
30% tienen al menos 30 años, y el 20% son menores de 30 años y sanos. Si uno de
tales loretanos es escogido al azar, cuál es la probabilidad de que:
a. Sufra alguna enfermedad y tenga al menos 30 años.
b. Sufra alguna enfermedad si tiene al menos 30 años.
10. Cierta empresa se presenta a dos licitaciones X y Y con las siguientes opciones de
ganar: la probabilidad que pierda en las dos licitaciones es de 30%; mientras que la
probabilidad de ganar solamente una licitación es de 60%. Además, la probabilidad de
ganar solamente en X es de 40%.
a. Calcule la probabilidad de ganar ambas licitaciones.
b. Calcule la probabilidad que gane la licitación Y si se sabe que no ganó X.
12. De 80 personas encuestadas, se encontró que 3/4 son solteras, 3/8 son mujeres y uno
de cada 10 hombres son casados.
a. Si se elige al azar una persona encuestada y resulta ser casada, calcular la
probabilidad de que sea un hombre.
b. Si se eligen al azar dos personas encuestadas y resultan ser del mismo sexo,
calcular la probabilidad de que ambos sean hombres.
13. Del primer examen de estadística resulta que el 40% de los alumnos está en el cuarto
superior. Se estima en 70% los alumnos que no estarán en el cuarto superior del
segundo examen y una probabilidad de 3/4 que un alumno no esté en el cuarto superior
del segundo examen si estuvo en el cuarto superior del primer examen. Si se elige al
azar un alumno de este curso, calcular la probabilidad de que esté:
a. En el 4to. superior del 2do. examen y no en el 4to. superior del 1er. Examen.
b. En el cuarto superior del segundo examen si no estuvo en el cuarto superior del
primero.
14. En una muestra de 480 huanuqueños se encontró que el 60% sufre alguna enfermedad,
el 30% tienen al menos 20 años, y el 20% son menores de 20 años y sanos. Si dos de
tales huanuqueños son escogidos al azar,
a. ¿Cuál es la probabilidad de que los dos sufran alguna enfermedad y tengan al
menos 20 años?
b. ¿Cuál es la probabilidad de que uno de ellos sufra alguna enfermedad?
15. En una universidad, el 70% de los estudiantes son de Ciencias y el 30% de Letras; de
los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%. Si
se elige aleatoriamente un estudiante, calcule la probabilidad que sea un estudiante:
a. Varón, si es de Ciencias.
b. Ciencias, si es varón.
c. Ciencias y varón.
16. Suponga que en una oficina hay 100 calculadoras de las cuales 60 son eléctricas y las
otras son manuales. Además, hay 70 máquinas nuevas mientras que las otras son
usadas. Hay 30 máquinas nuevas y manuales. Si se escoge una máquina al azar:
a. ¿Cuál es la probabilidad de que sea eléctrica?
b. ¿Cuál es la probabilidad de que sea manual si se sabe que es usada?
18. Un hombre tiene dos carros A y B que tienen problemas de arranque. La probabilidad
de que ambos arranquen es 0,1 ; la probabilidad de que arranque B y no A es 0,2 ; la
probabilidad de que ninguno de ellos arranque es 0,4. Halle la probabilidad de que:
a. El carro A arranque.
b. Arranque A dado que B no arrancó.
20. Una empresa tiene la siguiente información acerca de la preferencia del distrito X sobre
tres de sus productos A, B y C.
- El 50% prefiere el producto A. - El 37% prefiere el producto B.
- El 30% prefiere el producto C. - El 12% prefieren A y B.
- El 8% prefieren sólo A y C. - El 5% sólo prefieren B y C.
- El 15% prefieren solamente C.
Si se escoge al azar a una persona del distrito X, determinar la probabilidad:
a. Que no prefiera a ninguno de sus productos.
b. Que prefiera el producto A si se sabe que también prefiere al producto
21. Un grupo de jóvenes acudieron a una fiesta y presentaron las siguientes características:
36% usaban anteojos, 38% llevaban saco, 40% usaban corbata, 18% usaban anteojos y
saco, 14% usaban saco y corbata, 14% usaban anteojos y corbata, 10% usaban
anteojos, saco y corbata. Determine la probabilidad que al escoger un estudiante al
azar:
a. Use anteojos y saco pero no corbata.
b. No use ni anteojos, ni saco, ni corbata.
c. Use corbata si se sabe que usa anteojos.
22. En el mercado laboral, últimamente tienen gran demanda aquellos profesionales con
conocimientos avanzados. Se sabe que el 15% de los que solicitan empleo sólo tienen
conocimientos de Visual Basic, el 10% sólo conoce Lenguaje C y el 5% sólo conoce
Pascal. El 30% no tiene conocimiento de estas tres herramientas de programación.
También, se sabe que el 35% tiene experiencia solamente en dos de los tres lenguajes
de programación.
a. Halle la probabilidad de que al entrevistar a un postulante a un puesto de
programador, este conozca Visual Basic, Lenguaje C y Pascal.
b. Halle la probabilidad de que un postulante conozca los 3 lenguajes si se sabe que
conoce al menos uno.
24. En una ciudad, el 70% de los adultos escuchan radio, el 40% lee periódico y el 10% ve
televisión; entre los que escuchan radio el 30% lee periódicos y el 4% ve televisión. El
50% de los que ven TV lee el periódico y sólo el 2% de la población total lee periódico,
ve TV y escucha radio. Si se elige una persona al azar, calcule la probabilidad:
a. Que sólo realice una de las tres actividades.
b. Sabiendo que lee periódico, que vea televisión.
c. Escuche radio o vea TV.
6. DISTRIBUCIÓN BINOMIAL
Función de Probabilidad
PX k / B : n, C 1
n k n k
k
7. DISTRIBUCIÓN DE POISSON
Función de Probabilidad
e .k
PX k / P :
k!
Donde: X = Variable aleatoria
λ = Valor promedio de ocurrencias para el intervalo en que está definida la
variable
K = Número de eventos comprendidos en la frecuencia del parámetro λ
Cuando N tiende a infinito y es tal que el producto entre ambos parámetros tiende
a ser igual al parámetro λ; entonces, la distribución de la variable aleatoria Binomial se
puede aproximar, a una distribución de Poisson. Para esto, la equivalencia de
parámetros es la siguiente:
n
En la práctica, esta aproximación se suele utilizar cuando es pequeño y el valor de n
es muy grande.
9. DISTRIBUCIÓN NORMAL
1 x 2
1
2
f ( x) e dx
2
X ~ N(μ , σ) Z ~ N(0 , 1)
Este proceso de normalización se realiza utilizando las fórmulas que dependen del tipo
de Distribución Normal utilizada.
x
z
Este proceso de transformación permite el uso de tablas estadísticas previamente
elaboradas, en las cuales se tienen los valores de probabilidad de la variable
normalizada Z. Con esto, el cálculo de la probabilidad resulta más práctico, sencillo y
rápido.
Si una muestra aleatoria de tamaño "n" es extraída de una población con distribución
dada, con media y desviación estándar , entonces la distribución de la variable
aleatoria con media muestral X se aproxima cada vez más a una distribución normal
cuando "n" tiende al infinito; es decir:
X N (μX , σ X )
( X ) n
Z
Los pasos a seguir para analizar este caso de probabilidad son los siguientes:
Si una muestra aleatoria de tamaño "n" es extraída de una población con distribución
dada, con proporción poblacional , entonces la distribución de la variable aleatoria de
una proporción muestral (p) se aproxima cada vez más a una distribución normal
cuando "n" tiende a infinito; es decir:
p N (p, p )
Así, la distribución de la variable aleatoria para una distribución muestral de medias se
realiza de la siguiente manera:
X
Z
(1 )
n
Nótese que representa la probabilidad de éxito de un experimento de Bernoulli.
X 1
Z 2n
(1 )
n
Donde el factor de corrección (1/2n) se aplica de la siguiente manera:
Los pasos a seguir para analizar este caso de probabilidad son los siguientes:
Actividades propuestas
A.- Distribución Binomial
4. Se sabe que el 40% de las personas que se presentan a un empleo son altamente
capacitadas en el manejo de Visual Basic. Si 25 personas se presentan a un empleo:
a. ¿Cuál es la probabilidad de que 10 sean altamente capacitadas en VB?
b. ¿Cuál es la probabilidad de que por lo menos 2 sean altamente capacitadas en el
manejo de Visual Basic?
8. Suponga que los motores de un avión de cierta marca, que operan independientemente,
tienen una probabilidad de falla de 0,1. Suponga que un avión efectúa un vuelo exitoso
si al menos la mitad de sus motores operan normalmente. Determine cuál avión, uno
con cuatro y otro con seis motores, tiene mayor probabilidad de efectuar un vuelo
exitoso.
10. Se sabe que la probabilidad de que falle un sensor de temperatura de una incubadora
es de 0,35. En un hospital se han instalado dos incubadoras de los modelos A y B, la
incubadora A posee 6 sensores y la incubadora B posee 9 sensores. Suponga que una
incubadora realiza una medición correcta de la temperatura de un bebé si al menos los
dos tercios de sus sensores funcionan correctamente. ¿Cuál de los modelos de
incubadoras elegiría?
11. Una máquina produce cierto tipo de piezas, de las cuales un promedio de 5% es
defectuosa. En una muestra aleatoria de cinco piezas. Cuál es la probabilidad de
obtener:
a. Exactamente una pieza defectuosa.
b. Por lo menos una pieza defectuosa.
12. El Instituto Nacional del Niño se encuentra probando dos nuevos modelos de
incubadoras para recién nacidos basadas en sensores electrónicos de temperatura. Las
especificaciones del fabricante afirman que la probabilidad de que falle un sensor es de
0,35. En el hospital se han instalado dos incubadoras de los modelos A y B, la
incubadora A posee 6 sensores y la incubadora B posee 9 sensores. Suponga que una
incubadora realiza una medición correcta de la temperatura de un bebé si al menos los
dos tercios de sus sensores funcionan correctamente. Basando solamente en criterios
estadísticos; ¿cuál de los modelos de incubadoras elegiría el Instituto Nacional del
Niño? Justifique su respuesta.
14. Un tratamiento para cierta enfermedad produce una cura en 75% de los casos. Se
seleccionan 6 pacientes aleatoriamente. Calcule la probabilidad de que:
a. Todos estén curados.
b. Ninguno esté curado.
c. Exactamente cuatro estén curados.
d. Al menos cuatro estén curados.
15. Se conoce que los tornillos producidos por una cierta compañía son defectuosos con
probabilidad 0.01, independientemente uno del otro. La compañía vende los tornillos en
paquetes de 10 y garantiza que no más de uno de los 10 tornillos es defectuoso. Si se
vende uno de estos paquetes. ¿Cuál es la probabilidad que este sea reemplazado por
la compañía?
16. Una empresa ha instalado bombas de agua de una determinada marca en edificios de
departamentos, 10% de los cuales presentan fallas luego del primer año de uso. Si se
inspeccionan 15 bombas de agua de dicha marca en edificios de departamentos que
han sido instalados hace más de un año. ¿Cuál es la probabilidad que más de 5 de las
bombas presenten fallas?
17. Ud. es contratado como programador senior por la empresa “TEXTILES ANDINOS” para
diseñar el software integrado de facturación, balance, compras y salarios de la empresa.
Durante el desarrollo del software se deben realizar pruebas de verificación para constatar
que el programa funciona perfectamente. Ud detecta que la probabilidad de que el software
genere un error de proceso es de 0,02%. Si los usuarios del software son 100.
a. Calcule la probabilidad de que menos de 10 usuarios reporten un error de proceso.
b. Calcule la probabilidad de que exactamente 7 usuarios reporten un error de
proceso.
18. Dos equipos de fulbito: “Mi Barrio FC” y “Trome Sport” se preparan para su partido del
fin de semana en el campeonato de tercera división. Los entrenadores de ambos
equipos saben que, según las estadísticas, los delanteros de “Mi Barrio FC” tienen una
efectividad de gol de 40%; mientras que la efectividad de gol de “Trome Sport” es de
60%. Los entrenadores estiman que en el encuentro “Mi Barrio FC” efectuará 10
disparos directos al arco; mientras que “Trome Sport” efectuará solamente 7 disparos
directos al arco.
a. ¿Cuál es la probabilidad que “Trome Sport anote 2 goles como máximo?
b. ¿Cuál es la probabilidad que “Mi Barrio FC” anote más de 3 goles?
c. ¿Cuál es la probabilidad que el partido quede 0 a 0?
19. El 90% de los tubos de ensayo soportan una temperatura mayor a 80ºC; suponga que
10 de estos tubos se someten a una prueba a temperaturas mayores de 80ºC.
Determine la probabilidad que 3 de estos tubos quede inutilizables.
21. La probabilidad de fallar durante el vuelo para cada uno de los seis motores de un avión
es 0,0005. Suponiendo que los seis motores trabajan independientemente, determine la
probabilidad que en un vuelo determinado:
a. No ocurra ninguna falla del motor.
b. No ocurra más de una falla.
c. Ocurra exactamente dos fallas.
22. De todas las personas que han pasado una prueba de aptitud a un trabajo en los
últimos años, 90% han tenido éxito desempeñando ese trabajo, ¿Cuál es la probabilidad
de que cinco de seis solicitantes que han pasado la prueba recientemente tengan éxito
en el trabajo? ¿Cuál es la probabilidad que por lo menos cinco tengan éxito?
23. Cierto tubo de televisión tiene una probabilidad de 0,3 de funcionar más de 400 horas.
Si se prueban 15 tubos:
a. Hallar la posibilidad que exactamente 0, 4, 9 de ellos funcionen más de 400 horas.
b. ¿Cuántos tubos espera encontrar que funcionen por lo menos 400 horas?
c. ¿Cuál es el número de tubos más probable que funcionen por lo menos 400 horas?
24. Suponga que el 20% de las solicitudes de préstamo en un banco son aceptadas. Si se
elige al azar a 8 personas que solicitaron el préstamo, Calcule la probabilidad que:
a. A 2 de ellas se le acepte el préstamo.
b. A por lo menos 5 se le acepte el préstamo.
c. Se le acepte el préstamo a más de 6 personas si se sabe que se le ha aceptado a
por lo menos 2.
3. En la playa “Las Olas” los salvavidas se encuentran preparándose para sus actividades
en la temporada veraniega. Ellos saben que en temporada veraniega el 5% del total de
bañistas son asistidos por dificultades en la playa. Si se escogen al azar 200 bañistas,
¿cuál es la probabilidad que al menos 7, pero menos de 13 hayan sido asistidos por los
salvavidas?
4. Una cajera de un supermercado puede atender en promedio a dos clientes por minuto.
Calcule la probabilidad para que:
a. Pueda atender a 5 clientes en el lapso de dos minutos.
b. Pueda atender por lo menos a dos clientes en el lapso de un minuto.
5. Los accidentes de trabajo que se producen por semana en una fábrica, siguen la ley de
Poisson, de tal manera que la probabilidad que haya 5 accidentes es 16/15 de la
probabilidad de que haya 2 accidentes:
a. Halle el parámetro de la distribución de Poisson.
b. La probabilidad de que no haya accidentes en tres semanas.
6. Una de cada cinco veces que se llegó a un puente levadizo, éste se encontraba
levantado por lo que se tuvo que detener el auto para luego continuar el camino.
a. Calcule la probabilidad de que en las siguientes siete aproximaciones al puente
este no se halle levantado.
b. ¿Cuál es el número de veces que se espera encontrar el puente levantado?
9. El Bureau of Printing and Engraving of United States es una oficina gubernamental que
tiene la función de imprimir el papel moneda de su país. Debido a su gran
responsabilidad esta oficina tiene una frecuencia extraordinariamente pequeña de
errores de impresión: apenas 0,05% de los billetes contienen errores como para que no
se permita su circulación. ¿Cuál es la probabilidad de que de un lote de 10000 billetes,
diez de ellos contengan errores como para que no puedan circular?
10. El gerente de control de calidad de las galletas Marilyn’s está inspeccionando un lote
recién horneado de galletas con hojuelas de chocolate. Si el proceso de producción está
bajo control, el número promedio de hojuelas por galleta es 6,0. ¿Cuál es la
probabilidad de que en cualquier galleta en particular que se inspeccione se encuentren
exactamente cinco hojuelas?
11. Suponga que cierto alimento produce una reacción alérgica en un 0,01% de una
población grande. Si 100 000 personas comen este alimento diario en promedio:
a. ¿Cuál es la probabilidad de que 5 de ellos sean, alérgicos a este alimento?
b. ¿Cuál es el número esperado de personas con reacción alérgica?
12. Suponga que cierta enfermedad rara afecta al 0,1% de la población grande. Se escogen
aleatoriamente a 5000 personas de esta población y son sometidos a un examen para
detectar la enfermedad.
a. ¿Cuál es el número esperado de personas con dicha enfermedad?
b. ¿Cuál es la probabilidad que exactamente 10 personas queden afectadas por la
enfermedad?
13. Una máquina controlada por computador que realiza bordados en casacas
impermeables puede realizar en promedio 1 bordado en el lapso de 90 segundos. En un
momento determinado se produce un corte de fluido eléctrico y la máquina empieza a
trabajar con su energía de reserva la cual le permite operar durante 6 minutos. Si al
momento del corte de fluido eléctrico, en la línea de producción todavía quedan 7
casacas por bordar; ¿cuál es la probabilidad que pueda bordar más de 3 pero por lo
menos 6 casacas impermeables? Justifique su respuesta.
14. En una compañía, el sistema queda suspendido a razón de 2 veces por mes. Determine
la probabilidad de que:
a. En dos meses, el sistema quede suspendido por lo menos 4 veces.
b. En dos meses, el sistema quede suspendido más de 5 veces, si se sabe que luego
de un mes el sistema ya quedó suspendido una vez.
15. Se ha observado que el promedio de ventas del producto “A” en una empresa es de 3
unidades por hora. Si se supone que las ventas son independientes una de otra, y si X
representa el número de ventas cada 20 minutos ¿Cuál es la probabilidad que:
a. En el intervalo de 20 minutos no se realice venta alguna
b. Se realice al menos 2 ventas, en el intervalo de 20 minutos
18. Los analistas de Estudios de Mercado estiman que en promedio un encuestador reporta
1 encuesta falsa de cada 15 que realiza con tal de completar su trabajo. Si a un
encuestador se le da la tarea de realizar en un mañana 81 encuestas; determine la
probabilidad de que este encuestador traiga más de 10 encuestas falsas.
20. Un sistema puede atender en promedio a 2 operadores simultáneos en una hora. Sin
embargo el sistema colapsa cuando es requerido por más de 3 operadores
simultáneamente en una hora.
a. ¿Cuál es la probabilidad que el sistema colapse?
b. Si se define X: Número de veces que el sistema colapsa en 24 horas, determine la
distribución de probabilidades de X.
21. Como una forma de hacer control de calidad en una empresa comercializadora de puertas
de madera, el dueño exige que antes de salir de la fábrica cada puerta labrada sea revisada
en busca de imperfecciones en la superficie de la madera. El encargado de control de
calidad encontró que el número medio de imperfecciones por cada puerta labrada es 0,5. El
dueño decidió que todas las puertas con dos o más imperfecciones sean rechazadas y sean
devueltas para su reparación. ¿Cuál es la probabilidad de que una puerta labrada falle la
inspección y sea devuelta para su reparación?
22. Ud. es un auditor de software que es contratado para verificar el buen funcionamiento
de un nuevo software de análisis crediticio de la cooperativa “SANTA MARIA”. El
programador en jefe ha estimado que la probabilidad de que en el software se genere
un bucle que interrumpa los procesos de cálculo de crédito es de 0,025. Si en total 40
son los analistas de crédito que utilizarán este nuevo software, halle la probabilidad que
menos de cuatro analistas reporten un bucle en el proceso.
23. Un cajero automático está programado para atender en promedio a dos movimientos de
los clientes por minuto. Calcule la probabilidad que:
a. Pueda atender a 4 movimientos de los clientes en el lapso de dos minutos.
b. Pueda atender por lo menos a tres movimientos de los clientes en el lapso de un
minuto.
27. Suponga que un libro de 585 páginas contiene 43 errores tipográficos. Si estos errores
se distribuyen aleatoriamente a través del libro. ¿Cuál es la probabilidad que 10
páginas, seleccionadas al azar, no contengan errores?
29. Cierta enfermedad puede ocurrir 1 vez por cada cien mil habitantes. Calcule la
probabilidad de que en una ciudad con 500 000 habitantes todos estén sanos.
30. Un laboratorio afirma que cierto medicamento para combatir la depresión causa efectos
secundarios en una proporción de 5 de cada 100 pacientes. Para contrastar esta
afirmación, otro laboratorio elige al azar a 5 pacientes a los que se les aplica dicho
medicamento. ¿Cuál es la probabilidad que al menos dos tengan efectos secundarios?
32. La probabilidad de que una persona sufra una reacción alérgica a un determinado
medicamento es 0,001. Determine la probabilidad de que un total de 2 000 personas
que han tomado el medicamento,
a. Exactamente 3 tengan reacción alérgica.
b. Más de dos personas tengan reacción alérgica.
c. Halle el número esperado de personas con reacciones alérgicas y su varianza.
33. Suponga que la probabilidad de que un motor falle en un vuelo de rutina entre dos
ciudades es 0,005. Use la aproximación de Poisson a la distribución Binomial para
encontrar aproximadamente la probabilidad de que:
a. Por lo menos una falla en 1 000 vuelos.
b. Por lo menos dos fallas en 1 000 vuelos.
34. La probabilidad de que se haga una soldadura defectuosa en una conexión dada es
10-4. Considere un sistema de 5x104. conexiones soldadas independientemente.
a. ¿Cuál es la distribución de probabilidad del número de uniones defectuosas en el
sistema? ¿Cuáles son los parámetros?
b. Utilice, una aproximación, a la verdadera distribución, para calcular la probabilidad
de que no se presenten defectos en el sistema.
1. Los pesos de las impresoras marca ZZ se distribuyen normalmente con media 1,5 kg. y
desviación estándar 0,3 kg. Determine lo siguiente:
a. La probabilidad de que una impresora elegida al azar pese menos de 1,3 Kg.
b. El porcentaje de impresoras que pesan entre 1,4 y 1,65 Kg.
c. Si la producción de impresoras es de 5 000, ¿Cuántas pesan más de 1,75 Kg?
2. El tiempo que demora “cargar” un sistema se distribuye normalmente con media 20 seg.
y desviación estándar de 2,5 seg. Determine lo siguiente:
a. La probabilidad de que el sistema se demore en cargar menos de 18 seg.
b. El porcentaje de veces que el sistema se demora en cargar más de 21 seg.
6. Del aeropuerto al centro de la ciudad se puede llegar mediante dos caminos. Si se viaja
por el camino A, el tiempo está distribuido normalmente con media 27 minutos y
varianza de 25 minutos. Si se viaja por el camino B, el tiempo está distribuido
normalmente con media 25 minutos y desviación estándar de 12 minutos. ¿Por cuál
camino es preferible ir al centro de la ciudad si se dispone de 30 minutos?
10. Se ha encontrado que el tiempo de servicio que se requiere por persona en una caja
bancaria tiene una distribución aproximadamente normal con media de 130 segundos y
varianza de 2025 segundos.
a. Calcule la probabilidad de que se requiera menos de 100 segundos
b. ¿Cuál es el tiempo mínimo que utilizan el 20% de las personas que más se
demoran?
12. Una empresa naviera después de realizar estudios de mercado encontró, que uno de
los parámetros no está tomando en cuenta el peso promedio de la carga. Por tal motivo
realiza cambios en los costos de embarques de los conteiners que serán transportados
de continente a continente, para ello, ha establecido parámetros de peso en sus cargas
de envío vía marítima. Suponga que los pesos de los grupos electrógenos a gasolina
marca Honda que se envían desde Japón para ser entregadas en Perú, siguen una
distribución normal con media de 78kg. y una desviación estándar de 10kg. Si el 95%
de los pesos de estos motores se encuentran entre a y b. Halle los valores de a y b, si
estos son simétricos respecto a la media.
13. El bar “Un par más” ha instalado una máquina automática para la venta de cerveza. La
máquina puede regularse de modo que la cantidad media de cerveza por vaso sea la
que se desea; sin embargo, en cualquier caso esta cantidad tendrá una distribución
normal con una desviación estándar de 5,9 mililitros.
a. Si el nivel se ajusta a 304,6 mililitros, ¿qué porcentaje de los vasos contendrán
menos de 295,7 mililitros?
b. ¿A qué nivel medio debe ajustarse la máquina para que sólo el 2,28% de los vasos
contengan menos de 295,7 mililitros?
c. ¿A qué nivel medio debe ajustarse la máquina para que el 84,13% de los vasos
contenga menos de 313,6 mililitros?
14. La cevichería “El buen pez”, ubicada en la Costa Verde se encuentra estimando la
cantidad de cerveza que deberá pedir a su concesionario para tener la suficiente
cantidad diaria de cerveza en esta temporada playera. La cevichería sabe, de veranos
anteriores, que el consumo de cerveza tiene una desviación estándar de 350 ml. ¿Cuál
debe ser la cantidad promedio de consumo de cerveza en mililitros para que el 39,743%
de los clientes tenga un consumo mayor a 1966 ml?
15. Se está construyendo un grupo de 100 casas en la urbanización San Borja. El material
empleado en las redes de desagüe es tal que el 9,512% de las tuberías de desagüe
tiene periodos de duración que exceden los 15 años y que el 62,556% tienen períodos
de duración que exceden los 9 años. Considerando que la distribución de probabilidad
de los periodos de duración de estas tuberías es normal, determínese la media y la
varianza de esta distribución.
16. Una nueva empresa de servicios informáticos desea instalar el Sistema Operativo Linux,
con la intención de ahorrar costos en la compra de software licenciado. Usted es
contratado para asesorar la decisión que deberá tomar la empresa. Según información
de los proveedores, el Linux CONECTIVA tiene un rendimiento promedio de 18,000
horas con una desviación estándar de 5,000 horas; mientras que el Linux CENTOS
tiene un rendimiento promedio de 20,000 horas con una desviación estándar de 3,000
horas. ¿Cuál es el Sistema Operativo Linux que elegiría, si la empresa desea que el
rendimiento total de las computadoras debe ser como mínimo 22,000 horas? Justifique
su respuesta.
18. Una máquina automática para el llenado de paquetes de café puede regularse de modo
que la cantidad media de arroz llenado sea la que se desee. Si la cantidad de café
depositada se distribuye normalmente con una varianza igual a 100 gr² ¿Cuál debe ser
el valor de la regulación media de modo que sólo el 1% de los paquetes tengan un peso
inferior a 990 gr?
19. El tiempo que se requiere para reparar cierto tipo de transmisión automotriz en un taller
mecánico tiene distribución normal con media 45 minutos y varianza de 64 minutos. El
gerente de servicio planea hacer que se inicie la reparación de la transmisión de los
automóviles de los clientes, diez minutos después de que se recibe el vehículo y le dice
al cliente que el vehículo estará listo en una hora. ¿Cuál es la probabilidad que el
gerente esté equivocado?
20. Una fábrica de neumáticos hace una prueba para medir la duración de sus llantas y
verificó que la duración de las llantas tenía distribución normal, con media 48000 Km., y
desviación estándar de 2000 Km.
a. Calcular la probabilidad que una llanta escogida al azar dure entre 45000 Km. y
50000 Km.
b. El fabricante quiere garantizar que la llanta durará por lo menos “N” Km., ¿Cuál
deberá ser el valor de “N” para que la probabilidad de que se equivoque sea menor
o igual a 5,05%?
c. Las llantas se venden asegurando que duran más de 45000 Km. ¿Cuál es la
probabilidad que de 5 llantas vendidas, exactamente tres tengan una duración
menor a la asegurada?
21. Los tiempos de vida de las baterías para automóvil marca WV tiene distribución normal
con media de 6750 h. y una varianza de 250000 h2. Según el tiempo de vida de las
baterías, estás son clasificadas de la manera siguiente: de clase A, si el tiempo de vida
es menor de 6000 h.; de clase B, si el tiempo de vida está comprendido entre las 6 000
y 7 400 h.; y de clase C, si el tiempo de vida es mayor de 7400 h.
a. Determine el porcentaje de baterías de cada clase que son fabricadas.
b. Si las baterías se transportan en cajas de 10 unidades, ¿Qué porcentaje de cajas
tendrá más de una batería de clase A?
22. Las estaturas de 1000 estudiantes están distribuidas normalmente con una media de 174,5
cm. y una desviación estándar de 6,9 cm. Suponiendo que las estaturas se redondean a la
media de centímetros más cercano, determine cuántos de estos estudiantes se espera que:
a. Tengan estaturas menores de 160cm.
b. Tengan estaturas entre 171,5 y 182cm.
c. Tengan estaturas mayores o iguales a 188 cm.
25. El número de días entre la facturación y el paso de las cuentas corrientes de crédito en
una tienda de departamentos grande tiene una distribución aproximadamente normal
con una media de 18 días y una varianza de 16 días. ¿Qué proporción de las facturas
será pagada?
a. Entre 12 y 18 días
b. Entre 20 y 23 días
c. En menos de 8 días
d. ¿Dentro de cuántos días estará pagado el 99,5% de las facturas?
e. ¿Entre cuáles dos valores simétricamente distribuidos alrededor de la media recaerá el
98% de las facturas?
1. Las lámparas que fabrica cierta empresa tienen una vida de 800 hrs. y una desviación
típica de 60 hrs. Halle la probabilidad de que una muestra aleatoria de 16 lámparas
tengan una vida media entre 769 y 810 hrs.
2. Las cuentas por cobrar de un bróker de seguros tienen un promedio de S/. 6,000; con
una desviación estándar de S/. 1,200. Con el fin de evaluar a sus trabajadores, el
supervisor de la aseguradora selecciona una muestra aleatoria de 36 cuentas por
cobrar. Si el supervisor encuentra que el promedio de cuentas por cobrar de la muestra
es mayor a S/. 6,500 soles, significará que el bróker no ha cumplido con las metas
mínimas trazadas por lo que será cambiado a un área de menor responsabilidad. ¿Cuál
es la probabilidad que el bróker sea cambiado de área?
4. Mary Bartel, auditora de una gran compañía de tarjetas de crédito sabe que el saldo
promedio mensual de un cliente dado es $112 y la desviación estándar es $ 56. Si Mary
audita 50 cuentas seleccionadas al azar, encuentre la probabilidad que el saldo
promedio mensual de la muestra sea entre $100 y $130.
7. Calvin Ensor, presidente de la General Telephone Corp., está molesto por el número de
teléfonos producidos por su empresa que tienen auriculares defectuosos. En promedio,
110 teléfonos al día son devueltos por este problema, con una desviación estándar de
64. El señor Ensor ha decidido que ordenará la cancelación del proceso al menos que
pueda estar 80% seguro de que en promedio no se devolverán más de 120 teléfonos al
día durante los siguientes 48 días. ¿Terminará ordenando la cancelación del proceso?
10. En un centro comercial, se sabe por experiencias anteriores que el 45% de los clientes
utiliza su tarjeta de crédito para efectuar sus pagos por las compras realizadas en
alguna de las tiendas. Si en un día cualesquiera 75 personas realizan compras en el
centro comercial. ¿Cuál es la probabilidad que más de 30, pero menos de 40 personas
paguen con tarjeta de crédito? Justifique su respuesta.
11. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de
40 horas. Halla la probabilidad de que una muestra aleatoria de 16 focos tenga una vida
promedio entre 775 horas y 820 horas.
13. Ciertos tubos fabricados por una compañía tienen una duración media de 800 horas y
una desviación estándar de 60 horas. Halle la probabilidad de que una muestra al azar
de 196 tubos, tomada entre ellos, tenga una duración media entre 790 y 810 horas.
15. Según los reportes de ventas del 2012, las ventas mensuales de una tienda de artículos
deportivos están distribuidas normalmente con media 6000 dólares y desviación
estándar de 1000 dólares. Si se escoge una muestra aleatoria de 6 meses, ¿Cuál es la
probabilidad que el promedio mensual de la muestra esté comprendido entre 5800
dólares y 6100 dólares?
16. Una firma de pedidos por correo sabe por experiencias anteriores que de las circulares
que envía por correo, el 10% tendrá respuesta. Suponga que se envían 20 circulares
como prueba de mercado en una región geográfica. Además, suponiendo que se puede
aplicar la tasa de respuestas del 10% en la nueva región:
a. Calcule la probabilidad de que menos del 20% de la gente responda.
b. Calcule la probabilidad de que contesten entre el 25% y 35% de la gente.
17. Un sistema está formado por 100 componentes que funcionan independientemente. La
probabilidad de que cualquier componente falle durante el periodo de operación es igual
a 0,10. Si el sistema sí funciona al menos con 85 componentes, calcule la probabilidad
de que no funcione el sistema.
18. Una empresa multinacional tiene una población de 250 vendedores. Estos vendedores
tienen un nivel medio de ventas de 5200 dólares con una desviación estándar de 1200
dólares. Si se seleccionan al azar una muestra de 20 vendedores, ¿Cuál es la
probabilidad de que su nivel de ventas esté comprendido entre 5000 y 5800 dólares?
19. Un jugador peruano de fútbol acierta 3 de 5 disparos penales. Suponiendo que durante
toda su carrera realiza 120 lanzamientos, determine la probabilidad de que anote por lo
menos 45 goles.
20. El 85% de las planchas de acero con un nuevo revestimiento de aluminio y un nuevo
tratamiento térmico, genera una mejora ante la corrosión de las sales de mar. En los
laboratorios navales, un barco es revestido con 20 planchas de este tipo, simulando
diferentes tipos de mares y diferentes tipos de salinidad. Si T es el tiempo de vida
promedio estimado para estas planchas mejoradas, ¿Cuál es la probabilidad que a lo
más el 25% de estas planchas no lleguen al tiempo (T) de vida promedio estimado?
22. Suponga que los pesos de los pasajeros que viajan por el bus metropolitano siguen
una distribución normal con media 72 Kg. y desviación estándar 25 Kg. ¿Cuál es la
probabilidad de que el peso total de una muestra al azar de 100 pasajeros exceda en
promedio los 80 Kg?
23. Una máquina automática para el llenado de paquetes de café puede regularse de modo
que la cantidad media de arroz llenado sea la que se desee. Si la cantidad de café
depositada se distribuye normalmente con una varianza igual a 100 gr² ¿Cuál debe ser
el valor de la regulación media de modo que sólo el 1% de los paquetes tengan un peso
inferior a 990 gr?
24. Según un sondeo publicitario, se sabe que el 40% de las personas prefieren consumir
una determinada marca de cerveza. ¿Cuál es la probabilidad que en una muestra de
144 personas, el porcentaje de personas que prefieran dicha marca de cerveza sea
mayor a 65%?
25. Los pesos de un grupo de personas de cierta ciudad se distribuyen normalmente con
media igual a 65 Kg. y varianza igual a 25 Kg. Determine Ud. la probabilidad que el
peso promedio de 36 personas elegidas al azar, este comprendido entre 62 Kg. y 73 Kg.
26. El tiempo que se requiere para reparar cierto tipo de transmisión automotriz en un taller
mecánico tiene distribución normal con media 45 minutos y varianza de 64 minutos. El
gerente de servicio planea hacer que se inicie la reparación de la transmisión de los
automóviles de los clientes, diez minutos después de que se recibe el vehículo y le dice
al cliente que el vehículo estará listo en una hora. ¿Cuál es la probabilidad que el
gerente esté equivocado?
28. Determine Ud. la probabilidad de que en una muestra de 120 lanzamientos de una
moneda, el número de caras esté comprendido entre el 40% y el 60%.
Resumen
Para el análisis estadístico, por lo general, no es necesario saber “cuáles” son los
elementos de un experimento, sino “cuántos” elementos son.
Los eventos tienen un comportamiento similar al de los conjuntos. Por ello, los
diagramas de Venn-Euler son bastante útiles en el cálculo de probabilidades.
En una distribución Binomial y una distribución de Poisson, se debe tener en cuenta que
la variable por estudiar debe ser discreta.
En una distribución normal, se debe tener en cuenta que la variable que se estudia debe
ser continua.
Para una distribución normal estándar, se debe tener en cuenta la media promedio y la
desviación estándar.
Bibliografía
MOYA CALDERON, RUFINO
2007 Probabilidad e inferencia estadística. Editorial San Marcos.
(519.5 MOYA 2007)
ANDERSON, DAVID R.
2008 Estadística para administración y economía. Editorial Thomson
(519.5 ANDE 2008)
DEVORE, JAY L.
2005 Probabilidad y estadística para ingeniería y ciencias. Editorial Thomson
(519.5 DEVO 2005)
WEIERS, RONALD
2007 Introducción a la estadística para negocios. México, D.F.: Thomson
(519.5 WEIE)
UNIDAD DE APRENDIZAJE
TEMARIO
Análisis de regresión
Análisis de correlación
ACTIVIDADES PROPUESTAS
1. ANÁLISIS DE REGRESIÓN
El modelo que se establezca puede tener la forma de la ecuación de una recta (modelo
lineal), de la ecuación de una parábola, de la función logarítmica, de la función
exponencial, etc.
Son diagramas que utilizan el sistema cartesiano para mostrar los valores de dos
variables para todo un conjunto de datos. Estos datos se representan en una
gráfica como un conjunto de puntos, relacionando el valor de una variable (eje X)
con su valor correspondiente en la otra variable (eje Y).
Y = a + b.X
Donde los coeficientes “a” y “b” son los siguientes:
X
X y Y
Y
n n
SC( X) X
X
2
2
y SC( Y ) Y 2
Y 2
n n
SP( XY ) XY
X Y
n
SP( XY )
b y a y bx
SC( X)
SC( Y ) b2SC( X)
S XY
n2
4. ANÁLISIS DE CORRELACIÓN
Para determinar el nivel de intensidad de la relación entre las dos variables estudiadas,
se utiliza el Coeficiente de Correlación de Pearson (r), cuyo valor está comprendido
entre –1 y 1. El valor del coeficiente “r” se calcula a través de la siguiente fórmula:
SP( XY )
r
[SC( X)][SC( Y )]
La interpretación del Coeficiente de Pearson se muestra en la siguiente Tabla:
Como se puede observar, cuando r tiende a 1, diremos que la relación entre las
variables es bastante intensa y además directa; en cambio, si el valor de r es cercano
a –1, la relación también es muy intensa pero inversa. Por otra parte, si el valor de r se
acerca a cero, podemos afirmar que no existe ninguna correlación.
Una vez que se ha establecido el modelo de regresión, nos tenemos que hacer una
pregunta final: ¿qué tan confiables son las predicciones que se hagan a través del
modelo obtenido? Para determinar esto, tendremos que calcular el Coeficiente de
Determinación (r2). Este coeficiente nos indica el porcentaje en que la variación de la
variable dependiente es “explicada” por la variable independiente. Dicho de otra
manera, el Coeficiente de Determinación nos indica el nivel de confiabilidad que se
debe tener para los resultados estimados con la ecuación de regresión. Los valores de
este coeficiente se encuentran comprendidos entre 0 y 1 y mientras más cercano se
encuentre de 1, el modelo será más confiable. Su cálculo se realiza de la siguiente
manera:
b 2 [SC( X)]
r
2
SC( Y )
5. EJEMPLO DE APLICACIÓN
En la siguiente tabla, se muestran las ventas que tuvo una empresa en 10 años
pasados. Sobre la base de esta información, se pide determinar lo siguiente:
a) La recta de regresión y el error estándar de estimación.
b) El coeficiente de correlación y el coeficiente de determinación.
c) El estimado de ventas que esta empresa tuvo en el año 2001.
AÑO VENTAS
1991 0.2
1992 0.4
1993 0.5
1994 0.9
1995 1.1
1996 1.5
1997 1.3
1998 1.1
1999 1.7
2000 1.9
SOLUCIÓN:
Primeramente, es necesario determinar cuál de las variables es independiente (X) y
cuál es dependiente (Y). Seguidamente, se realizan los primeros cálculos para
determinar los promedios y las sumatorias. (Ver cuadro adjunto)
2
N
N
X
199552 82,5
i1
SC( X)
i1
X i2
N
39820285-
10
2
N
N
Y
10,62 2,884
i1
SC( Y )
i1
Yi2
N
14,12
10
N N
N
X Y
i1 i1
19955x10,6
SP( XY) X i Yi 21166,8 14,5
i1
N 10
Y 350,148 0,176X
r 2 0,94003 0,88366
2
De acuerdo a los valores de “r”, el valor 0,88366 nos indica que la ecuación es
confiable.
Finalmente, la estimación de ventas (en millones de dólares) para el año 2001 es como
sigue:
Y 350,148 0,176X
Y 350,148 0,176(2001)
Y 2,028
1 2
Actividades Propuestas
1. El continuo aumento en el precio del petróleo en los últimos años ha originado un
aumento, también continuo, en los costos para el industrial que tiene que transportar
sus bienes terminados al mercado. Para abatir los costos de transporte, el industrial ha
sustituido los medios usuales de transporte por otros más baratos; por ejemplo flete
ferroviario en lugar de carga aérea. En un estudio hecho en una compañía para estudiar
los costos de transporte aéreo, se seleccionaron al azar 9 facturas de transporte aéreo
utilizado para enviar mercancía, para estimar la relación entre el costo por unidad
transportada y la distancia recorrida. Los resultados se encuentran en la tabla siguiente:
Costo por unidad transportada $49 $93 $159 $115 $66 $90 $139
a) Encuentre Ud. la ecuación de regresión lineal simple para estimar el costo de transporte
(por unidad transportada) a partir de la distancia recorrida.
b) Estime Ud. el costo medio de transporte por unidad para una carga que se enviará a
1700km.
c) ¿Qué tan confiable es dicha ecuación? Justifique estadísticamente su respuesta.
2. La corporación José R. Lindley está embotellando la bebida Aquarius Frugos que está
entrando al mercado capitalino, y desea evaluar la campaña publicitaria promocional. El
departamento de mercadeo preguntó a un grupo de consumidores: ¿Cuántas botellas de
tamaño personal Aquarius había comprado la semana anterior?; y ¿Cuántos anuncios
Aquarius había escuchado o leído la semana anterior? En la siguiente tabla se muestra las
respuestas de 7 encuestados para esas preguntas:
Número de anuncios 13 15 12 11 10 14 16
3. Se hace un estudio para determinar la relación entre las edades de un gran grupo de
máquinas en una fábrica y la eficiencia de las máquinas .Las siguientes son las edades
(en años) y un índice compuesto de eficiencia para una muestra aleatoria de ocho de
estas máquinas.
Edad (x) 2 4 11 9 4 6 7 8
Eficiencia (y) 90 65 25 40 80 60 35 50
Nivel de ruido 4 3 1 2 6 7 2 3
Grado de nerviosismo 39 38 16 18 41 45 25 38
Cantidad de equipos en un lote 1000 1500 2500 3000 4500 5000 7000
7. Se ha diseñado una prueba para mostrar a los supervisores de una compañía, sobre los
riesgos de sobre supervisar a sus trabajadores. Un trabajador de la línea de ensamblaje
tiene a su cargo una serie de tareas complicadas. Durante el desempeño del trabajador,
un inspector lo interrumpe constantemente para ayudarlo a terminar las tareas. El
trabajador después de terminar su trabajo, recibe una prueba psicológica diseñada para
medir la hostilidad del trabajador hacia la autoridad (una alta puntuación significa una
hostilidad baja). A ocho distintos trabajadores se le asignaron las tareas y luego se les
interrumpió con propósitos de asistencia de instrucción un número variable de veces y
sus calificaciones correspondientes en la prueba de hostilidad se revelan en la siguiente
tabla.
Cantidad de equipos en un
1000 1500 2500 3000 4500 5000 7000
lote
Cantidad de equipos
12 15 26 35 42 62 80
defectuosos
9. Durante los partidos recientes de tenis, un jugador ha observado que sus lanzamientos
no han sido totalmente eficaces porque sus oponentes le han regresado algunos de
ellos. Algunas de las personas con las que juega son bastante altas, así que se ha
estado preguntando si la altura de su oponente podría explicar el número de
lanzamientos no regresados durante un partido. Los siguientes datos se sacaron de
cinco partidos recientes.
Altura del oponente (H) pies 6,1 5,9 5.8 5.7 5,5 5.4 5,2 5.1 5,0
Lanzamientos no regresados(L) 18 15 12 10 8 7 6 5 3
Resumen
El Análisis de Regresión Lineal Simple es un método estadístico que permite establecer
un modelo estadístico que permita encontrar una relación cuantitativa entre dos
variables. Este modelo sigue la ecuación de una recta: Y = a + bX
Bibliografía
ANDERSON, DAVID R.
2008 Estadística para administración y economía. Editorial Thomson
(519.5 ANDE 2008)
WEIERS, RONALD
2009 Introducción a la estadística para negocios. México, D.F.: Thomson
(519.5 WEIE)
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / B: n,k]
P [X k / P: ]
P [X k / P: ]