Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IPN 1 CECYT-18
Medidas de dispersión ................................................................................................................ 70
Rango y amplitud................................................................................................................... 71
Varianza y desviación estándar para datos no agrupados ....................................................... 74
Varianza y desviación estándar para datos agrupados ............................................................ 77
Medidas de forma ...................................................................................................................... 80
Sesgo ...................................................................................................................................... 80
Curtosis .................................................................................................................................. 83
Teorema de Chebyshev........................................................................................................... 87
La regla empírica (Regla 68-95-99.7) ...................................................................................... 90
2. PROBABILIDAD...................................................................................................................... 94
Teoría de conjuntos ................................................................................................................... 94
Operaciones con conjuntos...................................................................................................... 97
Técnicas de conteo ................................................................................................................... 117
Combinaciones ..................................................................................................................... 124
Permutaciones ...................................................................................................................... 126
Permutaciones circulares ...................................................................................................... 132
Teoría de las probabilidades..................................................................................................... 136
Probabilidad Clásica............................................................................................................. 138
Probabilidad Frecuencial ...................................................................................................... 140
Eventos compuestos ............................................................................................................. 142
Regla del producto ............................................................................................................... 154
Probabilidad condicional ...................................................................................................... 158
El teorema de Bayes ............................................................................................................. 166
3. DISTRIBUCIONES DE PROBABILIDAD ............................................................................. 178
Distribuciones de probabilidad discreta .................................................................................... 178
Requisitos para una distribución de probabilidad discreta .................................................... 181
Funcion de distribución acumulada ...................................................................................... 182
Media, varianza y desviación estándar para distribuciones de probabilidad, discretas .......... 185
IPN 2 CECYT-18
Requisitos para una distribución de probabilidad ................................................................. 192
Función de distribución acumulada ...................................................................................... 194
Media, varianza y desviación estándar para distribuciones de probabilidad, continuas ......... 197
IPN 3 CECYT-18
1. ESTADÍSTICA DESCRIPTIVA
Introducción a la estadística
¿Por qué estudiar estadística?
La estadística es un área importante en la toma de decisiones del día a día y que está fuertemente
ligada a la vida diaria de los seres humanos; si analizamos programas de estudio de universidades, la
gran mayoría de ellos incluyen a la estadística desde un punto de vista particular, pero, en todas, el
interés será el valor típico y la variación que experimentan los datos; por ejemplo:
1) La estadística es una ciencia transversal pues apoya a distintos campos como el campo científico
social e industrial y colabora con otras ciencias para formar saberes nuevos; por ejemplo, al unir
la estadística con la biología, nace la bioestadística, al unirla con la psicología, nace la psicometría
y con la economía nace la econometría. Cuando se realiza un censo, se trata de un estudio en el
que visitan casa por casa para hace una encuesta que recolectará varios datos: cuántos viven en
el hogar, cuántos trabajan, estudian, sexo, edad, etc.
Esto permitirá saber cuántos habitantes habrá, cuántos son mujeres, hombres, cuántas familias
están en pobreza extrema y de ahí se pueden tomar decisiones como la implementación de
programas sociales que ayuden a corregir o mejorar las condiciones de vida de las familias y a
mejorar la situación del país.
2) Actualmente todos los países llevan un registro de todos sus casos positios de COVID-19, que se
presentan en el país, clasificándolos en leves, moderados, graves, recuperados y fallecidos;
posteriormente, a través de cálculos estadísticos, se puede predecir cómo se comportará el virus
en una determinada población de acuerdo a los datos recolectados. Toda esta información ayuda
a visualizar la magnitud del problema y desarrollar estrategias para evitar los contagios.
3) En una escuela, los docentes estamos acostumbrados a tomar las notas que los estudiantes
obtienen y se analizan el número de aprobados y reprobados y poder relacionar variables como,
por ejemplo, bajo rendimiento académico con la desnutrición, bajo nivel educativo de los padres
con la deserción escolar; estas variables podrían estar relacionadas y la estadística nos permitiría
saber si se relacionan o no.
IPN 4 CECYT-18
4) Durante las elecciones presidenciales a los candidatos se basan en estudios estadísticos para saber
las probabilidades que tienen de ganar las elecciones según la simpatía de los encuestados por
un candidato en particular. Este estudio podría dar una idea de quién podría ser el próximo
presidente de un determinado país.
5) Si quieres abrir un negocio, debes evaluar las probabilidades de que tenga éxito de acuerdo a
muchas variables, por ejemplo,
a. Es una zona residencial
b. Cuántos habitantes hay
c. Cuantos negocios iguales hay en la zona
d. Cuál es el ingreso promedio de las personas en esa zona
e. Etc.
6) Un estudio nos señala que en promedio 15 millones de personas en el mundo están utilizando
Facebook en este momento; luego, saber esta información le permite a una empresa vender sus
productos asegurando la mayor audiencia posible.
Así, los métodos estadísticos se utilizan para tomar decisiones que afectan en la vida diaria y que
pueden afectar en nuestro bienestar, por ejemplo:
a. Las compañías de seguros utilizan el análisis estadístico para establecer tarifas de seguros
de casas, autos, seguro médico, seguro de vida, ¿Por qué? A una mujer de 20 años le
quedan 60.25 años de vida, a un hombre de 87 años le quedan 4.56 años de vida; así, las
primas de seguros de vida se establecen con base en los cálculos de expectativas de vida.
b. Las agencias de protección ambiental toman muestras del agua periódicamente para
analizar la calidad de la misma.
c. Las investigaciones médicas estudian los niveles de curación de enfermedades, por ejemplo,
si un grupo de personas toma una aspirina de manera diaria y un grupo no lo hace, ¿se
reduce el riesgo de un ataque al corazón?
7) Conocer sobre los métodos que utiliza la estadística, facilita la comprensión sobre cómo tomar
decisiones y ofrecer un mejor entendimiento de cómo nos afectan. Por ello con el fin de tomar
una decisión informada y con base en estudios estadísticos, será necesario llevar a cabo lo
siguiente:
a. Determinar si existe información adecuada o si se requiere información adicional de manera
que no se obtengan resultados erróneos.
b. Resumir los datos de manera útil e informativa.
c. Analizar la información disponible.
d. Obtener conclusiones y hacer inferencias al mismo tiempo que se evalúa el riesgo de tomar
una decisión incorrecta.
IPN 5 CECYT-18
8)
ESTADÍSTICA. Es la rama de las matemáticas que se encarga de la obtención,
organización, análisis, interpretación y presentación de un conjunto de datos con el fin de
explicar y predecir algún fenómeno y tomar decisiones de forma eficaz.
Medidas de tendencia
Media, mediana, moda.
central
Estadística
Varianza, desviación
Descriptiva Medidas de dispersión.
estándar y rango.
IPN 6 CECYT-18
Algunos ejemplos para la estadística descriptiva son los siguientes:
La siguiente gráfica nos muestra la población en México de 1910 al año 2015 y se trata de
una estadística descriptiva si calcula el crecimiento porcentual de una década a otra.
Una gran cantidad de datos organizados como los censos de población, los salarios quincenales de
miles de trabajadores, las respuestas de 2000 votantes para elegir presidente de México, resultan de
poca utilidad si no tenemos un contexto de uso; sin embargo, la estadística descriptiva permite
organizar estos datos y darles significado.
1)
ESTADÍSTICA INFERENCIAL. Analiza los datos obtenidos en la estadística
descriptiva y de ahí surgen explicaciones sobre las características de la población estudiada.
IPN 7 CECYT-18
Por ejemplo:
¿Cómo hacer inferencias acerca de una población utilizando información contenida en una muestra?
La tarea se vuelve más sencilla si organizamos el problema en pasos lógicos:
IPN 8 CECYT-18
Población y muestra
}
1)
POBLACIÓN. Consiste de la colección de todos los individuos u objetos de interés
bajo consideración en un estudio estadístico.
MUESTRA. Es una parte de la población de interés de la cual se obtiene información.
En estadística, las muestras son tomas parciales de la población que se quiere analizar; luego, del
análisis que se hace de la muestra se hacen inferencias sobre la población.
Con el objetivo de inferir algo de la población, lo común es que se tome una muestra, para ello
consideremos los siguientes ejemplos:
IPN 9 CECYT-18
Tipos de variables
Una variable es una característica que cambia o varia con el tiempo o para diferentes personas u
objetos de estudio.
Variables
Cualitativas Cuantitativas
Estado civil
Color de cabello
Discreta Continua
Color de ojos
Sexo
IPN 10 CECYT-18
Muestreo
Seleccionar una muestra capaz de representar con exactitud las preferencias del total de la población
no es sencillo pues, debe ofrecer resultados que permitan obtener información y tomar decisiones. Un
buen muestreo resulta indispensable sobre todo cuando el estudio de toda la población resulta ser
muy caro (para un estudio sobre la vida media de un foco ahorrador, deben ser analizados muchos
focos hasta que se fundan o dejen de funcionar). Por lo tanto, definimos al muestro de la siguiente
forma:
De acuerdo con la teoría del muestreo, la muestra debe lograr una representación adecuada de la
población, reproduciendo lo mejor posible, los rasgos esenciales o las características importantes para
ser investigadas. Entonces, debe reflejar las similitudes y diferencias encontradas en la población.
Así, buscamos con el mínimo de costo obtener la máxima información sobre la población que se
estudia; por tanto, se debe tener cuidado para asegurar la aleatoriedad de las muestras.
Existen distintos tipos de muestreo o criterios de clasificación; analizaremos los llamados métodos de
muestreo probabilístico, para los cuales, todos los elementos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras tienen
la misma probabilidad de ser elegidas. Sólo estos métodos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables.
IPN 11 CECYT-18
Muestreo aleatorio simple
Es una muestra seleccionada de tal manera que, todos los elementos de la población
tienen la misma probabilidad de ser elegidos. Se asigna un número a cada individuo de
la población; luego, a través de algún medio mecánico (bolas dentro de una bolsa, tablas
de números aleatorios, software para generar números aleatorios (Excel, etc.),
calculadora, computadora, etc.) se eligen tantos sujetos como sea necesario para
completar el tamaño de la muestra requerido.
Seleccionamos la muestra con los números y con ayuda de algún software para generar números
aleatorios.
De esta forma, hemos seleccionado a 20 estudiantes con la técnica de muestreo aleatorio simple.
Suponga que, se está estudiando una población compuesta de N=360 estudiantes y se quiere una
muestra de n=30.
IPN 12 CECYT-18
Se elige un número aleatorio entre 1 y k, es decir, 1 y 12 que se determina de forma aleatoria y será
nuestro punto de arranque.
Se inicia el proceso de elección sistemática con el primer dato, por ejemplo, el 3, segundo elemento
3+12=15, tercer elemento, 15+12=27, …
El proceso termina cuando se completan los 30 estudiantes que serán la muestra para nuestro estudio.
En una línea de producción se puede hacer un muestreo cada 200 unidades o cada determinado
tiempo seleccionar una muestra para el análisis.
Muestreo estratificado
Se tiene un muestreo estratificado cuando se tiene una población que puede ser dividida
en varias subpoblaciones a las que llamamos estratos, de acuerdo con ciertas
características que deben cumplir sus integrantes.
Suponga que, se está estudiando una población compuesta de N=360 estudiantes y se quiere una
Consiste en considerar categorías distintas entre sí (estratos-subpoblaciones) que poseen
gran homogeneidad respecto a alguna característica (profesión, municipio, sexo, estado
civil, etc.); lo que pretende este muestreo es que todos los estratos de interés estén
representados adecuadamente en la muestra.
Suponga que se debe seleccionar una muestra de tamaño 20% de toda la población del cecyt-18 que
tiene 1000 estudiantes.
La muestra debe cumplir la condición de que exista al menos un representante de cada una de las
carreras técnicas que tiene la institución educativa que son: laboratorista químico (250 estudiantes),
sistemas digitales (320 estudiantes) y mantenimiento industrial (430 estudiantes).
El tamaño de la muestra es del 20% con 200 estudiantes que se deben tomar de entre las carreras
laboratorista químico, sistemas digitales y mantenimiento industrial; luego, el tamaño de la muestra
por estrato (carreras) será la siguiente:
IPN 13 CECYT-18
320
𝑆𝑖𝑠𝑡𝑒𝑚𝑎𝑠 𝑑𝑖𝑔𝑖𝑡𝑎𝑙𝑒𝑠 =
1000
250
𝐿𝑎𝑏𝑜𝑟𝑎𝑡𝑜𝑟𝑖𝑠𝑡𝑎 𝑞𝑢í𝑚𝑖𝑐𝑜 =
1000
430
𝑀𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑎𝑙 =
1000
De esta forma el 20% de la muestra queda representado por todos los estratos 𝑛 + 𝑛 + 𝑛 .
Suponga que se quiere realizar una encuesta de los usuarios del metro de la ciudad de México (con 4
millones de usuarios diarios aproximadamente).
IPN 14 CECYT-18
Fuentes de información
Las técnicas de recolección y el diseño de experimentos facilitan la obtención de los datos en forma
rápida y económica, de ellas depende el éxito de una buena información; éstas deben ser lo más
apegadas a la población que se está estudiando. Las fuentes o formas más comunes de recolección de
datos son:
Entrevista por teléfono. Su ventaja es que es rápido, barato y sencillo y se pueden cubrir
grandes áreas sin desplazarse. Sólo se pueden hacer preguntas sencillas y las personas que
contestan no siempre quieren responder a las preguntas, pues les causa molestia.
De puerta en puerta. Contienen alto grado de respuesta, los cuestionarios deben ser cortos,
se cubren grandes áreas, etc.
Abordaje en la calle. Las áreas deben ser de gran movimiento, se utilizan generalmente
para cuestionar sobre la aceptación de determinados productos, debe ser breve ya que la gran
mayoría de los entrevistados tienen prisa o están sujetos a determinado horario.
Entrevista personal. Resulta costosa y emplea mucho tiempo, por lo general son muestras
pequeñas, se debe tener en cuenta la buena selección de los entrevistados pues de ellos
dependen las respuestas obtenidas.
Entrevista en centros comerciales. Es común cuando se desea saber el impacto de algún
producto, se suele desarrollar en áreas con mucho flujo de personas (centros comerciales,
plazas, etc.)
Entrevistas a través de las redes sociales. Hoy en día, las entrevistas a través de medios
como Facebook, twitter, etc., han cobrado mucha importancia por su facilidad y la gran
capacidad para abarcar grandes cantidades de datos y en poco tiempo.
Luego, la recolección de datos es muy importante y cómo se lleve a cabo es un factor determinante
para la obtención de datos verídicos y confiables.
IPN 15 CECYT-18
Representación gráfica de datos
Cuando trabajamos con conjuntos de datos, resulta útil organizarlos y resumirlos a través de tablas,
gráficas, histogramas, entre otros, que permitan su mejor comprensión y una mejor toma de
decisiones.
Histograma
Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin
espacios entre sí). La escala horizontal representa las clases de valores de datos y en cuanto que la
escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de
frecuencia.
Una tubería de aluminio por donde pasará oxígeno en un hospital, se fabrica bajo una estricta
especificación de un diámetro de 5 0 .0 2 5cm . De un lote de 1000 tubos se ha tomado una muestra
de 50 tubos cuyas medidas se listan a continuación:
5.018 5.016 5.022 5.018 5.030 5.002 5.011 4.992 5.001 4.998
4.982 5.018 4.991 5.017 5.000 5.031 5.018 4.976 5.023 4.999
4.994 5.001 4.998 5.016 5.017 5.009 5.019 4.989 5.026 4.990
4.978 5.000 4.989 4.990 4.998 5.010 5.002 5.020 5.016 4.980
5.013 5.001 5.026 4.992 4.992 5.003 4.994 4.984 5.021 5.015
IPN 16 CECYT-18
1. Encontrar el rango. Localizamos el dato menor y el dato mayor, es decir,
rango x max x min 5.031 4.976 0.055
2. Determinar el número de clases. Definimos el número de clases a generar, para el cual,
10
podemos tomar k 1 log(N ) clases recomendadas (redondeando), de modo que,
3
10
k 1 log(50) 6.6632 7 clases o categorías.
3
NOTA: En estadística no hay una cantidad establecida para las clases, sólo se recomienda
algo razonable, no pocas clases o no demasiadas. Algunas reglas utilizadas son las siguientes:
NOTA: Hay ocasiones en que las clases ya están establecidas de modo que, no es necesario
desarrollar todo este procedimiento.
IPN 17 CECYT-18
5. Agrupamos los datos respecto a cada clase.
1 [4.976-4.984) //// 4
2 [4.984-4.992) ///// / 6
5 [5.008-5.016) //// 4
7 [5.024-5.032) //// 4
TOTAL --- 50
1 [4.976-4.984) 4
2 [4.984-4.992) 6
3 [4.992-5.000) 8
4 [5.000-5.008) 9
5 [5.008-5.016) 4
6 [5.016-5.024) 15
7 [5.024-5.032) 4
TOTAL 50
IPN 18 CECYT-18
6. Se procede a generar el histograma, el cual incluye el eje vertical las frecuencias y en el eje
horizontal los límites reales de intervalos de clases de los datos, con lo cual se obtiene el
diagrama siguiente:
Una vez que tenemos el histograma con la información requerida, podemos realizar el análisis a
partir de la información inicial, en este caso, “bajo una estricta especificación de un diámetro de
5 0 .0 2 5cm ”.
De modo que, esto nos permite una tolerancia de acuerdo a los estándares de calidad para tubos
con medidas que están entre los valores [4.975 5.025] .
Observando el histograma podemos ver que los tubos de las primeras dos clases y la última clase,
no cumplirán con el estándar de calidad.
EJEMPLO: Considere las calificaciones del grupo 6IM1 en la unidad de aprendizaje de probabilidad
y estadística de 28 estudiantes. Construya una tabla con la distribución de frecuencias y genere una
gráfica de pastel.
7 10 10 7 3 9 9
2 7 8 7 9 8 7
10 8 10 6 9 10 8
10 8 8 7 10 10 10
IPN 19 CECYT-18
1. Determinamos el rango, es decir, rango x max x min 10 2 8
2. Determinamos los intervalos de clase haciendo uso de la regla de Stuges
10 10
k 1 log(N ) 1 log(28) 5.8238 6
3 3
rango 8
3. Determinamos el ancho de las clases: I 1.3333
# de clases 6
4. Construimos la tabla correspondiente
1 [2-3.33] // 2
2 [3.34-4.66] 0
3 [4.67-5.99] 0
4 [6-7.33] /////// 7
5 [7.34-8.66] ////// 6
6 [8.67-10] ///////////// 13
TOTAL --- 28
1 [2-3.33] 2
2 [3.34-4.66] 0
3 [4.67-5.99] 0
4 [6-7.33] 7
5 [7.34-8.66] 6
6 [8.67-10] 13
TOTAL 28
IPN 20 CECYT-18
Se procede a generar la gráfica de pastel o circular con ayuda de algún paquete como Excel
o bien, de forma manual.
Polígono de frecuencias
El polígono de frecuencias muestra la forma que tiene una distribución y es similar a un histograma.
Consiste de segmentos de recta que conectan los puntos medios de la clase (marca de clase) y las
frecuencias de la clase.
IPN 21 CECYT-18
Por ejemplo, la siguiente tabla muestra las clases, las frecuencias absolutas y las marcas de clase o
puntos medios de cada una de las clases para ser graficados y formar así el polígono de frecuencias.
[15 a 18) 18 15 8
16.5
2
[18 a 21) 19.5 23
TOTAL 80
El polígono de frecuencias permite tener una vista rápida de las principales características de los
datos (máximos, mínimos, puntos de concentración, etc.).
IPN 22 CECYT-18
Ejemplo. Considere las medidas del pulso en latidos por minuto obtenidas de una muestra aleatoria
de 80 hombres con los resultados que se muestran a continuación.
HOMBRES
68 64 88 72 65 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 56 64 72
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 60 75
50 a 59 55.5 13
60 a 69 65.5 33
70 a 79 75.5 16
80 a 89 85.5 16
90 a 99 95.5 2
TOTAL 80
IPN 23 CECYT-18
Diagrama de tallo y hojas
Las gráficas de tallo y hoja se pueden utilizar para representar colecciones de datos numéricos y nos
permiten representar la distribución de una variable cuantitativa.
Para construirlo basta separar en cada dato el último dígito de la derecha y le llamaremos “hoja” y
al dígito o los dígitos de la parte izquierda le llamaremos “tallo”.
NOTA: los datos deben estar ordenados de menor o mayor. Consideremos la siguiente tabla con 24
datos numéricos:
67 82 89 95 102 121
70 84 91 96 107 124
IPN 24 CECYT-18
1. El primer paso es ordenarlos de menor a mayor. Ya están ordenados en la lista anterior.
3. Se hace el siguiente arreglo con los números obtenidos partidos por una barra en la cual se
coloca en la parte izquierda los datos más significativos y en la parte derecha de la barra los datos
menos significativos como se muestra a continuación:
6 7
7 0 2 3
8 2 4 4 7 9
9 1 2 2 5 6
10 0 0 2 7
11 2 3
12 1 4 6 6
Tallo Hoja
Observe que cada uno de los datos menos significativos se agregan como hojas al lado derecho de
manera consecutiva como en el caso del 7 en tallo y 0 2 3 en hoja los cuales forman los números 70,
72 y 73.
Esta forma de representar información nos permite interpretar los datos de la siguiente manera:
¿Cuál es el dato que más se repite? En este caso son 84, 92, 100 y 126.
¿Cuál es el valor más alto observado? 126
IPN 25 CECYT-18
¿Cuántos datos hay en la muestra? 24
Ejemplo: el siguiente diagrama de tallo y hoja muestra las calificaciones obtenidas en un examen
de probabilidad y estadística. Responde lo siguiente con base en el diagrama.
2 2 3
3 0 0 0 9
4 0 1 1 6 9
5 0 3 5 7 8
6 0 1 1 5 6
7 0
Tallo Hoja
IPN 26 CECYT-18
Ojiva menor que y mayor que
Una ojiva es una gráfica que representa frecuencias acumuladas, y sirve para
determinar el número de frecuencias que se ubican por debajo o por encima de
algún valor específico.
La ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza fronteras de clase
a lo largo de la escala horizontal y frecuencias acumuladas a lo largo del eje vertical.
Para ilustrar el procedimiento para construir la ojiva mayor que y menor que, tomemos el
siguiente ejemplo:
Los siguientes datos corresponden al número de robos cometidos y la edad de los delincuentes
de una determinada ciudad.
[10,15) 8 5 8 13 45 8 37
[15,20) 20 13 20 33 37 20 17
[20,25) 10 43 7
[25,30) 5 48 2
[30,35) 2 50 0
TOTAL N=50
IPN 27 CECYT-18
Las ojivas respectivas, quedan establecidas de la siguiente manera:
Localizamos en el gráfico un
aproximado de 18 años en el
eje “x” y trazamos una vertical
hasta interceptar a la gráfica
para después trazar una
perpendicular que nos permita
encontrar la intersección con el
eje “y” y poder encontrar la
cantidad de robos que se
cometen por menores de edad que en este caso podemos decir que son aproximadamente 30 robos
(60%, lo que significa que más del 50% de los robos se cometen por menores de edad).
Podemos decir que el 10% de los robos se cometen por niños menores de 10 años, es decir, 5
de cada 50 robos se cometen por niños menores de 10 años.
Localizamos en el gráfico un
aproximado de 18 años en el
eje “x” y trazamos una
vertical hasta interceptar a la
gráfica para después trazar
una perpendicular que nos
permita encontrar la
intersección con el eje “y” y
poder encontrar la cantidad de
robos que se cometen por menores de edad que en este caso podemos decir que son aproximadamente
20 robos (lo que significa que más del 40% de los robos se cometen por mayores de edad).
Una minoría de robos se cometen por personas mayores de 30 años; en este caso, diremos
que 2 de cada 50 robos, lo que representa el 4%.
IPN 28 CECYT-18
Diagrama circular
La circunferencia tiene una medida de 360° que serán distribuidos entre el 100% de nuestros datos.
fi
Para distribuir los porcentajes en la circunferencia tomamos para cada clase xi
N
360 . El
valor en grados se puede redondear por comodidad.
IPN 29 CECYT-18
De modo que el diagrama circular correspondiente a los datos que aparecen en la tabla
anterior son los siguientes:
Con el fin de organizar los datos para mostrar una distribución general de éstos y el lugar donde
tienden a concentrarse, además de, señalar los datos poco usuales o extremos, el primer procedimiento
para organizar los datos es una tabla de distribución de frecuencias.
IPN 30 CECYT-18
Para ilustrar cada uno de los elementos analicemos la siguiente tabla de distribución de frecuencias
que ilustran los precios de venta de caminadoras para hacer ejercicio.
10
2. Determinar el número de clases. k 1 log(80) 7.3436 7 .
3
rango 20479
3. Determinar el ancho de cada clase. I 2925.571 3000 (se
# de clases 7
redondea a una cifra conveniente asegurándonos que se cubra el rango).
4. Establecer los límites de los intervalos o clases. Se debe evitar la superposición de
límites de clase. Por ejemplo, clases como 1300-1400 y 1400-1500 no deberían emplearse ya
que podrían causar confusiones. De modo que para evitar este tipo de situaciones es
recomendable el uso de intervalos semiabiertos.
5. Clasifique y contabilice cada uno de los datos en las clases que se han establecido previamente
como se muestra a continuación:
IPN 31 CECYT-18
6. Cuente el número de elementos de la clase. El número de elementos que hay en cada
clase recibe el nombre de frecuencia absoluta de la clase f i .
1 [15000-18000) 8
2 [18000-21000) 23
3 [21000-24000) 17
4 [24000-27000) 18
5 [27000-30000) 8
6 [30000-33000) 4
7 [33000-36000) 2
TOTAL
IPN 32 CECYT-18
NÚMERO DE Precios de venta FRECUENCIA Marca de clase
CLASE (Clases) ABSOLUTA Ext sup Ext inf
2
1 [15000-18000) 8 16500
2 [18000-21000) 23 19500
7. Frecuencia relativa. Es la proporción o porcentaje de los datos que caen en cada categoría o
clase. Para convertir una frecuencia de distribuciones en una distribución relativa, se divide cada
una de las frecuencias por clase entre el número total de observaciones. Luego su cálculo será a
fi
través de hi . La suma de frecuencias relativas acumuladas siempre es 1.
N
3 [21000-24000) 17 … 0.2125
4 [24000-27000) 18 … 0.225
5 [27000-30000) 8 … 0.1
6 [30000-33000) 4 … 0.05
7 [33000-36000) 2 … 0.025
TOTAL 80 1.0000
IPN 33 CECYT-18
Precios de FRECUENCIA Marca de clase Frecuencia Frecuencia
venta ABSOLUTA Ext sup Ext inf relativa acumulada
(Clases) 2
[15000-18000) 8 16500 8/80=0.1 8
TOTAL 80 1.0000
Para determinar, por ejemplo, el precio de venta debajo del cual se vendió la mitad de las bicicletas,
trazamos una línea horizontal sobre el 50% de las bicicletas vendidas y buscamos la intersección con
el eje “x” que, en este caso, es de 22.5; con esto podemos concluir que el 50% de las bicicletas se
vendieron en menos de $22500.
IPN 34 CECYT-18
ESTANDARÍZATE 1
1. Los siguientes datos muestran la temperatura que alcanzan cierto tipo de aparatos electrónicos
sometidos a una prueba de calidad.
98.6 97.2 97.4 98.6 98.0 98.2 98.2 97.5 98.5 98.8
98.4 98.6 99.6 98.8 98.8 99.0 98.0 98.0 97.3 97.3
97.6 98.6 98.4 98.9 98.0 98.6 98.4 97.8 98.6 97.6
98.7 98.6 98.6 98.7 98.6 98.0 97.0 98.4 98.0 98.6
98.2 97.7 98.0 98.6 99.4 99.5 98.3 97.0 98.4 98.4
c) Construir una ojiva menor que y mayor que. ¿Qué porcentaje de aparatos alcanzan una
temperatura menor de 98?2°?, ¿Qué cantidad de aparatos alcanzan temperaturas por encima de los
90°?
2. El siguiente diagrama de tallo y hojas muestra el peso en kg de distintas personas de varias edades.
4 5 9 9
5 2 2 3 7 9
6 0 3 4 6
7 0 3 9
8 1 2 5
9 1 2
Tallo Hojas
e) ¿Cuál es el peso promedio de las personas que están entre los 69 y los 86kg?
IPN 35 CECYT-18
3. Enseguida se muestran las duraciones de algunas películas para niños en minutos. Construya un
diagrama de tallo y hojas.
83 88 120 64 69 71 77 71 90 77
75 79 80 78 78 83 76 75 75 75
72 82 74 84 90 89 82 81 76 73
82 89 82 74 86 76 82 75 80 92
75 64 73 74 71 94 74 84 79 70
IPN 36 CECYT-18
5. Los siguientes datos son tiempos de ignición para ciertos materiales de tapicería expuestos
a una flama (dados a la centésima de segundo más cercana)
6. Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra
aleatoria simple de 40 hombres y 40 mujeres. Los médicos utilizan el pulso para medir la
salud de los pacientes; por ejemplo, si el pulso es muy alto se podría catalogar como una
infección o deshidratación.
a) Construye un polígono de frecuencias relativas para hombres y mujeres (en una misma
gráfica) y responde ¿qué puedes decir sobre los latidos de los hombres y las mujeres?
HOMBRES
68 64 88 72 65 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 56 64 72
MUJERES
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 60 75
IPN 37 CECYT-18
Medidas de tendencia central para datos no agrupados
Las medidas de tendencia central o promedios pueden ser usados en una gran variedad de contextos
y se considera que forman parte de la base de la estadística. Estas medidas de tendencia central nos
permiten describir las principales características de los datos analizados.
Gran parte de los conjuntos de datos, tienen una tendencia a agruparse alrededor de un punto central
y, de este modo, podemos elegir un valor que describa todo un conjunto de datos; luego, un valor
descriptivo como ese es una medida de tendencia central o “posición”. Las medidas de tendencia
central son:
Media Aritmética
Mediana
Moda
d (x X ) 0 .
i
i 1
i
Considere las calificaciones del área de matemáticas de Víctor que son: 6, 8, 7, 7, 6, 8. El promedio
687768
de sus calificaciones será X 7 . Así, la suma algebraica de las desviaciones
6
será: d 6 7 8 7 7 7 7 7 6 7 8 7 0
IPN 38 CECYT-18
Es muy sensible a los valores extremos, por ejemplo, observe los siguientes conjuntos de datos:
Ismael 34 años
Claudio 15 años
Carlos 9 años
Julieta 15 años
Jacobo 8 años
Frida 14 años
Toribio 9 años
Sebastián 16 años
Total 60
Total 60
15 15 14 16 60
La media para la primera tabla será: X 15 años y para el segundo caso
4 4
34 9 8 9 60
X 15 años.
4 4
Observe que en ambos casos la media vale 15 años, pero en la segunda tabla, la edad de Ismael eleva
mucho el promedio, de modo que, la media es muy sensible a valores extremos.
La siguiente tabla de datos nos muestra las calificaciones de un grupo de estudiantes de Cálculo
Diferencial. Encuentre la media para dicho grupo de datos e interprete su significado.
5 7 8 ... 6 9 119
La media del conjunto de datos está dada por X 7 , lo que
17 17
significa que, el promedio en las calificaciones obtenidas por los estudiantes del curso de
Cálculo Diferencial es de 7.
IPN 39 CECYT-18
MEDIANA
La mediana se define como aquel valor de la variable que supera a no más de la mitad de las
observaciones y al mismo tiempo, es superada por no más de la mitad de las observaciones, en otras
palabras, se puede definir como el valor central de un conjunto de datos.
120 3 14 1 99 7 30 2000 16
Ordenamos en primer lugar los valores de menor a mayor y como el número de datos es impar, la
mediana será el valor central, es decir, la mediana es el quinto dato ordenado que divide a la serie
en dos grupos de 4 datos cada uno. Por tanto, M e 1 6 .
1 3 7 14 16 30 99 120 2000
166 141 136 153 170 162 155 148 132 160 175 150
Ordenamos en primer lugar los valores de menor a mayor y como el número de datos es par, la
153 155
mediana será Me 154 .
2
132 136 141 148 150 153 155 160 162 166 170 175
IPN 40 CECYT-18
MODA
La moda se define como el valor que se presenta con la más alta frecuencia (el valor que más
se repite) en un conjunto de datos.
La moda es la única medida de tendencia central que puede ser utilizada con datos
cualitativos. Por ejemplo, el color favorito de un grupo de estudiantes.
La moda puede ser única, haber dos modas en un conjunto de datos o bien, existir
varias modas. También es posible que un conjunto de datos no tenga moda.
7.3 6.9 6.4 6.3 3.6 6.1 8.9 7.3 6.7 4.1 7.4 8.3
3.5 7.3 8.2 5.6 7.6 7.2 4.2 5.7 5.3 7.3 6.6 7.3
7.9 4.7 7.9 6.0 7.3 7.3 6.5 6.3 6.5 6.0 6.0 7.7
Observando los valores medidos de oxígeno disuelto se tiene que la moda o el valor más
típico o valor modal es 7.3%.
IPN 41 CECYT-18
Medidas de tendencia central para datos agrupados
La siguiente tabla nos muestra la cantidad de mensajes por WhatsApp que envían estudiantes
de bachillerato durante una semana a otros compañeros, amigos, miembros familiares, etc.
1 0-99 46
2 100-199 90
3 200-299 40
4 300-399 7
5 400-499 3
Total
f i
186
La tabla nos muestra en la primera línea que 46 estudiantes enviaron entre 0-99 mensajes
por WhatsApp, mientras que, en la segunda línea, 90 estudiantes enviaron entre 100 y 199
mensajes y así sucesivamente.
Tenemos el número de estudiantes, pero en este caso no contamos con la cantidad exacta de
mensajes que envió cada uno; en alguno otro caso sí se conoce, pero al agruparlos quedan
registrados en un cierto intervalo de datos.
IPN 42 CECYT-18
MEDIA (Media Aritmética)
f i
Para ilustrar el uso de la fórmula para el cálculo de la media analicemos el ejemplo anterior:
Observe que como no tenemos el valor exacto de mensajes que envió cada uno de los 46
estudiantes debemos tomar una marca de clase que represente a todo el intervalo, de modo
que se genera la columna “Marca de clase” que será el valor que represente a toda la clase.
Así, es cálculo de la media aritmética para el conjunto queda terminada por la expresión
X
(f x ) 29507 158.64
i i
f i
186
Por lo tanto, podemos señalar que en promedio cada estudiante envía 159 mensajes por
WhatsApp semanalmente.
IPN 43 CECYT-18
Ejemplo: Se realizó una encuesta sobre el número de hijos por hogar en el
municipio de Miahuatlan de Díaz, Oaxaca. Calcula la media del número de hijos
por familia.
f 18 i
IPN 44 CECYT-18
MEDIANA
Para calcular la mediana de un conjunto de datos agrupados, recuerde en el caso de datos no
agrupados la mediana es el dato que se encuentra a la mitad ya ordenando los datos de menor a
mayor o viceversa.
En el caso de datos agrupados, tenemos una tabla de frecuencias de modo que la mediana será
n
Fi 1
calculada del siguiente modo: Me Li
2 A
fi
n : Número de datos
IPN 45 CECYT-18
Ejemplo: La siguiente tabla muestra la distribución de frecuencias de la duración,
en horas, de uso continuo de 212 dispositivos electrónicos iguales, sometidos a cierta
prueba de control. Calcula la mediana y la media del conjunto de datos.
212
2. Sumamos las frecuencias absolutas ( f i ) y dividimos entre 2, es decir: 106 .
2
3. El valor 106 se sitúa en el intervalo por encima de la frecuencia acumulada correspondiente a
70, es decir, cae en el intervalo de frecuencia acumulada 150 que corresponde al intervalo [600-
650). Este será el intervalo de la mediana.
n 212
Fi 1 70
4. Calculamos la mediana, es decir: Me Li 2 A 600 2 50 622 horas.
fi 80
5. La media será: X
(f x ) 130100 613.68 horas.
i i
f i
212
IPN 46 CECYT-18
MODA
Para calcular la moda de un conjunto de datos agrupados, recuerde en el caso de datos no agrupados
la moda es el dato que más se repite.
En el caso de datos agrupados, tenemos una tabla de frecuencias, de modo que, la moda será calculada
fi fi 1
del siguiente modo: Mo Li A
( fi fi 1 ) ( fi fi 1 )
Observamos las frecuencias absolutas f i y tomamos aquella que es la más grande, es decir,
seleccionamos el intervalo donde se encuentra la frecuencia absoluta más grande.
fi fi 1
Calculamos Mo Li A
( fi fi 1 ) ( fi fi 1 )
IPN 47 CECYT-18
Sesgo
Una comparación de la media, la mediana y la moda puede mostrarnos algunas características del
sesgo en un conjunto de datos.
Cuando analizamos un conjunto de datos, podemos analizar el sesgo de las siguientes formas:
Sesgo negativo. Los datos sesgados hacia la izquierda dan como resultado una curva con
cola hacia la izquierda más larga y, en este caso, la media y la mediana se encuntran a la
izquierda de la moda.
Sesgo positivo. Los datos sesgados hacia la derecha dan como resultado una curva con cola
hacia la derecha más larga y, en este caso, la media y la mediana se encuntran a la derecha
de la moda.
Simétrica. En el caso de los datos que son simétricos (sesgo cero), la media, la mediana y
la moda son iguales.
IPN 48 CECYT-18
Ejemplo: Para el siguiente conjunto de datos agrupados, calcula la media, la
mediana y la moda.
La media será X
(f x ) 2713.8 35.707 36
i i
f 76
i
Por tanto la edad promedio en que se gana un premio a mejor actriz es a los 36 años.
n 76
Fi 1 28
La mediana de acuerdo a la tabla de datos será Me Li 2 A 31 2 9 34
fi 30
34 años es el valor central de las edades y de ahí el 50% de los datos corresponden a edades menores
a 34 años y el 50% están por enzima de los 34 años.
Por tanto, la edad en la que más actrices reciben un premio de la academia es a los 32 años.
IPN 49 CECYT-18
ESTANDARÍZATE 2
2.- El siguiente gráfico nos muestra las calificaciones obtenidas por estudiantes de un curso
de geometría analítica, ¿Se puede obtener la moda a partir del gráfico?, si es sí, encuéntrala.
12
10 10 10 10 10 10 10
10 9 9 9 9
8 8 8 8
8 7 7 7 7 7 7 7 7
6 6 6 6 6
6 5 5 5
4
2 2
2 1 1
IPN 50 CECYT-18
4. Calcula la media aritmética para los ingresos mensuales en pesos de un grupo de personas
que trabajan para la empresa “Emerton”.
a) Calcule la media, mediana y moda como datos no agrupados; posteriormente, calcule la media
mediana y moda como datos agrupados.
b) ¿Qué porcentaje de las playeras contienen más de 36% de algodón en el material usado para su
elaboración?
c) Construya un histograma y responda ¿Cuál de las tres medidas de tendencia central modela mejor
el comportamiento de los datos?
IPN 51 CECYT-18
6. La siguiente tabla muestra los ingresos anuales de un grupo de jugadores profesionales de Baseball.
Calcula la media, la mediana y la moda.
7. La siguiente tabla muestra las cantidades de nicotina en mg para una muestra de cigarrillos con
filtro y si filtro.
Sin 1.1 1.7 1.7 1.1 1.1 1.4 1.1 1.4 1.0 1.2 1.1 1.1 1.1
filtro
1.1 1.1 1.8 1.6 1.1 1.2 1.5 1.3 1.1 1.3 1.1 1.1 1.6
Con 0.4 1.0 1.2 0.8 0.8 1.0 1.1 1.1 1.1 0.8 0.8 0.8 0.8
filtro
1.0 0.2 1.1 1.0 0.8 1.0 0.9 1.1 1.1 0.6 1.3 1.1 0.6
IPN 52 CECYT-18
Medidas de posición
En muchos estudios estadísticos, necesitamos saber el valor por debajo del cual está una
determinada fracción de los datos; por ejemplo, si se tienen las calificaciones de un grupo de
estudiantes en una determinada unidad de aprendizaje, supóngase que se quiere conocer la
calificación por debajo de la cual se encuentran el 40% de los estudiantes. Así, además de la
mediana, que divide en dos mitades a un conjunto de datos, se pueden considerar otros
puntos de división. Uno de esos métodos consiste en determinar la ubicación de los valores
que dividen un conjunto de observaciones en partes iguales. Estas medidas incluyen los
cuartiles (Qk ), deciles ( Dk ) y percentiles ( Pk ) que analizaremos a continuación.
Los cuartiles son números que dividen a un conjunto de datos en cuatro partes iguales.
El cuartil uno Q1, es el punto por debajo del cual se ubica el 25% de los datos.
El cuartil dos Q2 , el es punto por debajo de cual se ubica el 50% de los datos . Este coincide
con la mediana.
El cuartil tres Q3 , es el punto por debajo del cual se ubican el 75% de los datos.
IPN 53 CECYT-18
Ejemplo: La siguiente tabla nos muestra los datos del tiempo en horas que 20 personas destinan a
ver el televisor semanalmente. Determina en interpreta los cuartiles para el conjunto de datos.
25 41 27 32 43
66 35 31 15 5
34 26 32 38 16
30 38 30 20 21
5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66
PASO 2. Calculamos la mediana del conjunto total de datos. En este caso, tenemos 20 datos de
modo que, la mediana será el promedio de los valores en las posiciones centrales 10 y 11, es decir,
30 31
Me Q2 30.5 que coincide con el cuartil dos.
2
PASO 3. Dividimos los datos ordenados en dos partes, la parte superior y la parte inferior. Si el
número de observaciones es impar, se incluye la mediana en ambas mitades.
5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66
Mitad inferior Mitad superior
PASO 4. Encontramos la mediana del conjunto de datos de la mitad inferior. Este valor coincide
21 25
con el primer cuartil (Q1), es decir, Q1 23 .
2
PASO 5. Encontramos la mediana del conjunto de datos de la mitad superior. Este valor coincide
35 38
con el tercer cuartil (Q3 ), es decir, Q3 36.5 .
2
Por lo tanto, vemos que el 25% de las personas ven menos de 23 horas, 25% de las personas ven
televisión entre 23 y 30.5 horas, 25% de las personas miran entre 30.5 y 36.5 horas y el 25% de las
personas ven más de 36.5 horas semanales.
IPN 54 CECYT-18
Otra manera de calcular los cuartiles de un conjunto de datos no agrupados, considera el siguiente
procedimiento:
PQ PQ
Si PQ n Qk (posición) es entera, entonces, el valor será Qk k k 1
( PQ y
k 2 k
Ejemplo: Determina e interpreta los cuartiles 0.25 y 0.50 para 19 mediciones sobre velocidades de
viento máximas en millas por hora para tormentas tropicales en el Atlántico.
PASO 2. Determinamos el valor de la fracción de los n datos (19 datos) que corresponde al
cuartil que queremos calcular, es decir, PQ n Qk (19)(0.25) 4.75
k
PASO 3. Como no es entero, tomamos la parte entera de 4.75 que será 4 y le sumamos 1 de acuerdo
con Qk PQ 1, luego, P0.25 5 (posición) que revisando los datos corresponde al valor
k
50. Esto significa que 25% de las velocidades, están por debajo de 50mph
Para el cuartil 0.50, multiplicamos (19)(0.50) 9.5 ; luego, como no es entero, tomamos la parte
entera y le sumamos 1, con lo que obtenemos que el cuartil 0.50 corresponde a la posición
10 que será 80. Esto significa que 50% de las velocidades de los vientos está por debajo de
80mph .
IPN 55 CECYT-18
Cuartiles (Qk ) para datos agrupados
Para el caso de datos agrupados, calcularemos el valor de cada uno de los cuartiles de la siguiente
forma:
k n
Para la posición del cuartil calculamos PQ , k 1,2,3 (según el cuartil)
k 4
k n
Fi 1
4
Luego, para el valor del cuartil tenemos que Qk Li A
fi
Donde:
Tiempo
Frecuencia fi Frecuencia
(minutos)
acumulada Fi
[30-35) 3 3
[35-40) 7 10
[40-45) 12 22 Q1
[45-50) 23 45 Q 2 , Q3
[50-55) 14 59
[55-60) 1 60
60
Total
IPN 56 CECYT-18
Calculamos las posiciones de los cuartiles:
1 60
Para el cuartil uno tenemos que PQ 15 . Luego, el 25% de las observaciones
1 4
1 60
10
4
se hayan a la izquierda de Q1 40 (45 40) 42.08 minutos.
12
2 60
Para el cuartil dos tenemos que PQ 30 . Luego, el 50% de las observaciones
2 4
2 60
22
4
se hayan a la izquierda de Q2 45 (50 45) 46.739 minutos.
23
3 60
Para el cuartil tres tenemos que para la posicion PQ 45 . Luego, el 75% de
3 4
3 60
22
4
las observaciones se hayan a la izquierda de Q3 45 (50 45) 50
23
De modo que el 25% de los datos se encuentran por debajo de 42.08 minutos, el 50% de los
datos se encuentran por debajo de 56.304 minutos y el 75% de los datos se encuentra por
debajo de 50 minutos.
IPN 57 CECYT-18
Deciles ( Dk ) para datos no agrupados y agrupados
Son una de las medidas de posición y constan de 9 valores que dividen un conjunto de datos
en diez partes iguales. Los deciles determinan los valores 10%, 20%, 30%,…, 90% de los datos,
donde el D5 coincide con la mediana Me y con el segundo cuartil Q2 .
buscada de los datos, n es el número total de datos y Dk es el decil buscado en decimal (10%
al 0.1, 20% al 0.2, etc).
Finalmente, dependiendo del valor resultante de PD n Dk , tenemos que:
k
PD PD
Si PD n Dk (posición) es entera, entonces, el valor será Dk k k 1
( PD y
k 2 k
28 30
tanto el decíl uno será D1 29 .
2
IPN 58 CECYT-18
Para el Decil cinco calculamos PD (0.50)(20) 10 , entonces, el valor es entero y por
5
38 40
tanto el decíl cinco será D5 39 .
2
43 48
por tanto el decíl nueve será D9 45.5 .
2
De estos hechos podemos concluir que el 90% de los estudiantes obtuvieron menos de 45.5;
el 50% de los estudiantes obtuvieron menos de 39 y sólo el 10% de los estudiantes obtuvieron
calificación mayor que 45.5 lo que representa un alto índice de reprobación.
Para el caso de datos agrupados, calcularemos el valor de cada uno de los cuartiles de la siguiente
forma:
k n
Para la posición del decil calculamos PD , k 1,2,3,...,9 (según el decil)
k 10
k n
Fi 1
10
Luego, para el valor del decil tenemos que Dk Li A
fi
Donde:
IPN 59 CECYT-18
Ejemplo: Se toma una muestra de 40 personas en un hospital en el área de urgencias para
medir el tiempo en que son atendidas. Se desea saber qué tiempo tarda el hospital en atender
al 30% y al 70% de las personas que acuden por una urgencia.
7.1-8.1 9 9
8.2-9.2 12 21 D3
9.3-10.3 9 30
10.4-11.4 9 39 D7
11.5-12.5 5 44
12.6-13.6 2 46
13.7-14.7 1 47
14.8-15.8 3 50
TOTAL 50
3 50
Para el decil tres tenemos que PD 15 . Luego, el 30% de las observaciones
3 10
3 50
9
10
se hayan a la izquierda de D2 8.2 (9.2 8.2) 8.7 minutos.
12
7 50
Para el decil siete tenemos que para la posicion PD 35 . Luego, el 75% de las
7 10
7 50
30
10
observaciones se hayan a la izquierda de D7 10.4 (11.4 10.4) 10.955
9
De modo que el 30% de los pacientes son atendidos en menos de 8.7 minutos y el 70% se
atienden en menos de 10.955 minutos, mientras que, el 30% se atienden en más de 10.955
minutos.
IPN 60 CECYT-18
Percentiles ( Pk ) para datos no agrupados y agrupados
Se definen como los intervalos dentro de los cuales quedan proporcionalmente repartidos los
datos sin agrupar, o bien, agrupados en una distribución formada por cien partes iguales.
Se tienen 99 percentiles que se simbolizan por Pk , en donde cada uno contendrá el mismo
número de datos, es decir, el 1% del total.
El primer percentil es el valor que indica en el cual, o por debajo del cual, queda el 1% de
un centésimo de todos los datos y así sucesivamente para todos los percentiles.
Determinamos el valor de la fracción de los n datos que corresponde al percentil que queremos
calcular, es decir, PP n Pk , donde PP es la posición correspondiente a la proporción
k k
PP PP
Si PP n Pk (posición) es entera, entonces, el valor será Pk ( PP y
k k 1
k 2 k
IPN 61 CECYT-18
Ejemplo: La siguiente tabla muestra las calificaciones obtenidas por 152 estudiantes del
cecyt-18 en la unidad de aprendizaje de probabilidad y estadística. Encontrar el P27,P61,P84 .
y por tanto P61 PP 1 [92.72] 1 92 1 93 que será la posición buscada y así,
61
decimal y por tanto P84 PP 1 [127.68] 1 127 1 128 que será la posición
84
buscada y así, el percentil 84 será P84 9.
De estos datos podemos concluir que el 27% de los estudiantes obtuvieron calificación menor
a 7; el 61% de los estudiantes obtuvieron calificación menor a 8 y el 15.7% obtuvieron 10 de
calificación.
IPN 62 CECYT-18
Para el caso de datos agrupados, calcularemos el valor de cada uno de los percentiles de la
siguiente forma:
k n
Para la posición del percentil calculamos PP , k 1,2,3,...,99 (según el percentil).
k 100
k n
Fi 1
100
Luego, para el valor del percentil tenemos que Pk Li A
fi
0-99 46 46
100-199 90 136 P30
200-299 40 176
300-399 7 183 P95
400-499 3 186
TOTAL 186
30 186
46
30 186
Para PP 55.8 . Luego, P30 40 100 (199 100) 50.78
30 100 90
minutos.
95 186
176
95 186 100
Para PP 176.7 . Luego, P95 300 (399 300) 309.9
95 100 7
minutos.
IPN 63 CECYT-18
Diagramas de caja y bigotes
Un diagrama de caja y bigotes es una presentación visual que describe características de un conjunto
Límite superior. Es el extremo superior del bigote. Las opiniones, datos o respuestas por
encima de este se consideran atípicos (poco comunes). Su medida está dada por
Q3 1.5(Q3 Q1)
Límite inferior. Es el extremo inferior del bigote. Las opiniones, datos o respuestas por
debajo de este se consideran atípicos (poco comunes). Su medida está dada por
Q1 1.5(Q3 Q1)
Primer cuartil (Q1). Por debajo de este valor se encuentra como máximo el 25% de los
datos.
Mediana o cuartil dos (Q2 ). Divide la distribución en dos partes iguales. El 50% de las
observaciones están por debajo de la mediana y el 50% está por encima.
Tercer cuartil (Q3 ). Por debajo de este valor se concentran el 75% de los datos.
Valores atípicos. Opiniones o valores que están apartados del cuerpo principal de los datos.
Pueden representar efectos de causas extrañas, opiniones extremas, o bien, errores de
medición o registro. Se considera un valor atípico si:
Dato atípico Q3 1.5(Q3 Q1)
Dato atípico Q 1 1.5(Q 3 Q 1 )
1. Los cuartiles 1, 2 y 3.
2. El valor máximo y mínimo (rango intercuartílico Su medida está dada por
IQR (Q3 Q1)
El rectángulo está dividido por una línea vertical que indica la mediana del conjunto de datos que
indica, además, su relación con el primer y tercer cuartil (recuerde que el segundo cuartil coincide
con la mediana). La caja se ubica a escala sobre un segmento que tiene como extremos los valores
IPN 64 CECYT-18
mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman “bigotes” y los
asteriscos representan datos atípicos o poco comunes.
Ejemplo: Se está probando la eficacia de un nuevo medicamento para mejorar la presión arterial en
personas hipertensas medido en minutos, registrando las siguientes mediciones:
Tiempo en minutos
7.13 5.35 10.14 4.15 5.85 4.69 6.84 0.94 3.45 5.79
5.64 4.92 5.32 6.56 6.17 4.33 6.18 6.50 3.74 2.98
1. El primer paso es ordenar los datos; luego, calcular los elementos para el diagrama de caja y
bigotes, como se muestra en el siguiente diagrama:
IPN 65 CECYT-18
Se observa una asimetría en el conjunto de datos ya que, la mediana no está al centro de la caja.
Esto significa que tenemos tiempos más bajos que la mediana y que están más separados del tiempo
promedio o mediana que aquellos que tienen un tiempo mayor al valor de la mediana que están más
agrupados.
¿En qué porcentaje de la población habría hecho efecto el medicamento después de 4.24
minutos? R. 25% de la población.
¿A partir de qué tiempo el medicamento le habría hecho efecto al 50% de la población? R.
5.495 minutos
¿Cuánto tiempo pasó para que el medicamento le hiciera efecto al 100% de la población?
10.14 minutos
¿Cuánto tiempo tardó el medicamento en hacerle efecto a 3/4 de la población? R. 6.34
minutos
IPN 66 CECYT-18
b) ¿Cuál hospital minimiza el tiempo de espera?
El hospital que minimiza el tiempo de espera es aquel que tiene menor diagrama de caja y bigotes;
luego, el primer hospital tiene un tiempo mínimo de espera que varía de 2 a 14 minutos (8 minutos),
el segundo hospital tiene un tiempo mínimo de espera de 16 minutos mientras que el tercer hospital
tiene un tiempo de espera de 24 minutos. Por lo tanto, el hospital que minimiza el tiempo de espera
es el hospital número uno.
c) Si se establece un tiempo de espera para atender una urgencia en 8 minutos, ¿Cuál hospital ofrece
mejor servicio de atención?
IPN 67 CECYT-18
ESTANDARÍZATE 3
a) Uno de los actores tenía 34 años de edad al momento de ganar el oscar y era mayor que 38 de los
otros actores, ¿Cuál es el percentil de la edad 34 años?
b) Uno de los actores tenía 29 años de edad al momento de ganar el oscar y era mayor que 20 de los
otros actores, ¿Cuál es el percentil de la edad 29 años?
c) Uno de los actores tenía 60 años de edad al momento de ganar el oscar y era mayor que 71 de los
otros actores, ¿Cuál es el percentil de la edad 60 años?
27 72 83 15 96 30 8 98 86 5 39 86 87 100 56
88 31 3 30 57 22 7 20 62 95 35 73 66 56 57
a) Calcula el P20 ,Q1 ,Q3 , D5 , D7
128 130 133 137 138 142 142 144 147 149
151 151 151 155 156 161 163 163 166 172
a) ¿Cuántos milibecquereles se contienen máximo en los dientes de leche de la primera mitad de la
población?
b) Se considera que una persona desarrollará problemas cardiacos en la edad adulta si han sido
expuestos a cantidades mayores a 150 milibecquereles ¿En qué porcentaje de la población se tendrán
problemas cardiacos futuros?
IPN 68 CECYT-18
4. Los siguientes datos muestran la distribución de frecuencias de la duración en horas de uso continuo
de una muestra de dispositivos electrónicos iguales, sometidos a cierta prueba de control.
Duración en Frecuencia f i
horas
[350-400) 4
[400-450) 6
[450-500) 9
[500-550) 20
[550-600) 31
[600-650) 80
[650-700) 42
[700-750) 10
[750-800) 8
[800-850) 2
Modelo 1985
141 359 247 940 882 494 306 210 105 880
200 223 188 940 241 190 300 435 241 380
Modelo 1995
b) Si en el modelo 1985 se retiran las 4 mediciones más altas, qué podría decir sobre las emisiones en
ambos modelos.
IPN 69 CECYT-18
Medidas de dispersión
Para describir el comportamiento de una serie de datos que se concentran en una distribución, se
emplean las medidas de tendencia central; para explicar el grado de dispersión o variación de los
datos (qué tan dispersos están respecto a la media) que se expanden alrededor de una medida central,
se utilizan las medidas de dispersión.
Un conjunto de datos puede tener un mismo centro o mediana, pero con aspecto diferente por la
forma en la que los valores se dispersan desde el centro. Por ejemplo, las siguientes distribuciones
de datos se centran ambas en 4, pero hay mucha diferencia en la forma en cómo se dispersan o varían.
En la primera gráfica los datos varían de 3-5 y en la segunda varían de 0-8.
Rango o amplitud
Varianza
Desviación estándar
nos pueden servir para crear un panorama sobre la dispersión de un conjunto de datos. Analizaremos
las siguientes medidas de dispersión.
IPN 70 CECYT-18
Rango y amplitud
El rango R de un conjunto de n datos o mediciones se define como la diferencia entre la medición
más grande y la más pequeña, es decir, Rango Dmayor Dmenor
Por ejemplo, si consideramos la siguiente tabla que nos muestra los pesos en lb de 30 bebés de
gestación completa al momento de nacer, podemos ver que el rango será Rango 9.4 5.6 3.8lb
7.2 7.8 6.8 6.2 8.2 5.8 6.8 6.8 8.5 7.5
8.0 8.2 5.6 8.6 7.1 6.1 7.9 9.4 9.0 7.8
8.2 7.7 7.5 7.2 7.7 8.5 9.0 7.7 6.7 7.7
Para el caso de datos agrupados hay dos formas de calcular el rango o amplitud:
1. La diferencia entre el límite superior de la clase más alta y el límite inferior de la clase más
baja, es decir, Rango LSCalta LICbaja
2. La diferencia entre la marca de clase de la clase superior y la marca de clase de la clase
inferior, es decir, Rango MCCsup MCCinf .
Habrá diferencias entre cada uno de los rangos debido a que los límites de la clase se extienden más
que la marca de clase.
El rango o recorrido es útil en situaciones que desean investigar variaciones extremas como la
temperatura máxima y mínima en un día, las velocidades máximas o mínimas en una carretera,
etc. El rango también presenta sus desventajas ya que depende solo de los valores mayor y menor,
por ejemplo:
Rango 22 7 15 Rango 22 7 15
X 13.5 X 13
Observe que en ambos casos el rango es 15, sin embargo, existe más variación o dispersión en los
datos del conjunto A, ya que, en los datos del conjunto B se muestran más compactos entre sí.
NOTA: el rango es una medida que sólo toma en cuenta dos datos (máximo y mínimo) y por tanto
se ve afectada por los valores extremos.
IPN 71 CECYT-18
Si observamos los datos anteriores vemos que en la muestra B), tiene sus valores más agrupados
alrededor de la media X 13 , mientras que la muestra A), están más alejados de ella ( X 13.5 ).
Por lo tanto, es necesaria una medida que considere la variabilidad o distancia promedio de los datos
con respecto a su media, es decir, obtener la distancia de cada dato respecto a la media y después
calcular el promedio de esas distancias. Para ello:
A) 7, 9, 10, 11, 14, 16, 19, 22 B) 7, 12, 12, 12, 13, 13, 13, 22
xi (xi X ) xi (xi X )
7 7-13.5=-6.5 7 7-13=-6
9 9-13.5=-4.5 12 12-13=-1
10 10-13.5=-3.5 12 12-13=-1
11 11-13.5=-2.5 12 12-13=-1
14 14-13.5=0.5 13 13-13=0
16 16-13.5=2.5 13 13-13=0
19 19-13.5=5.5 13 13-13=0
22 22-13.5=8.5 22 22-13=9
d 0 d 0
Observe en la tabla anterior que la suma de las diferencias en ambos casos es cero, de modo
que, si consideramos los cuadrados en cada una de las diferencias, eliminamos los valores
negativos y podemos calcular los promedios, entonces:
IPN 72 CECYT-18
A) 7, 9, 10, 11, 14, 16, 19, 22 B) 7, 12, 12, 12, 13, 13, 13, 22
xi (xi X) 2
xi (xi X)2
7 (7 13.5)2 42.5 7 (7 13)2 36
9 (9 13.5)2 20.25 12 (12 13)2 1
10 (10 13.5)2 12.25 12 (12 13)2 1
11 (11 13.5)2 6.25 12 (12 13)2 1
14 (14 13.5)2 0.25 13 (13 13)2 0
16 (16 13.5)2 6.25 13 (13 13)2 0
19 (19 13.5)2 30.25 13 (13 13)2 0
22 (22 13.5)2 72.25 22 (22 13)2 81
190.25 120
s2 27.178u 2 (Varianza) s2 17.14u 2 (Varanza)
7 7
s 5 .2 1 3 u (Desviación estándar) s 4 .1 4 u (Desviación estándar)
Ahora sí es posible distinguir entre la variación de los datos de un conjunto y el otro de una
manera más precisa haciendo uso de la varianza y de la desviación estándar. Concluimos:
1. La muestra A, tiene 8 datos, su promedio es 13.5, no significa que todos los datos sean
13.5, algunos valen más y otros menos, ¿Qué tanto se aleja cada dato respecto a 13.5?
unos se alejan más, otros menos, pero en promedio se alejan 5.213 unidades que es su
desviación estándar.
2. La muestra B, tiene 8 datos, su promedio es 13, no significa que todos los datos sean 13,
algunos valen más y otros menos, ¿Qué tanto se aleja cada dato respecto a 13? unos se
alejan más, otros menos, pero en promedio se alejan 4.14 unidades que es su desviación
estándar.
IPN 73 CECYT-18
Varianza y desviación estándar para datos no agrupados
En relación a la varianza y a la desviación estándar podemos decir que la varianza no tiene ningún
significado, pues se expresa en unidades cuadradas, de modo que, si hablamos de estudiantes en un
estudio, no tiene sentido hablar de unidades de estudiantes cuadrados; sin embargo, la desviación
estándar viene a definirse como la raíz cuadrada de la varianza y tiene las mismas unidades que los
datos y nos ofrece la variabilidad de los datos respecto a la media.
n 1
s2
media. n 1
Donde:
s 2 es la varianza muestral
s es la desviación estándar muestral
xi es el valor de cada observación de la muestra
X es la media de la muestra
n es el número de observaciones de la muestra
IPN 74 CECYT-18
Ejemplo: Los salarios por hora de una muestra de empleados de Zam’s club son: $120, $200,
$160, $180 y $190. Calcula la variación (desviación estándar) de los salarios respecto al
salario promedio de la muestra.
xi
x i
850
s 2
(x i
X )2
4000
1000
n 1 5 1
X
x i
850
$170 s
(x X)
i
2
1000 $31.62
n 5 n 1
Concluimos que en promedio cada uno de los sueldos varían aproximadamente $31.62
respecto al sueldo promedio.
IPN 75 CECYT-18
Ejemplo: Los siguientes datos muestran el tiempo de espera para ser atendidos en dos
empresas de planes telefónicos: “Telsel” y “Movister”. Calcule las desviaciones estándar en
los tiempos de espera de cada una de las empresas.
Una vez que tenemos las distancias respecto a la media al cuadrado, calculamos el valor de
la desviación estándar para los tiempos, es decir,
s
(x X) i
2
38.46
1.96 min s
(x X)i
2
1.36
0.11 min
n 1 11 1 n 1 10
Si observamos los datos, aunque ambas empresas tengan el mismo tiempo promedio de espera
(7.2 minutos), los tiempos de espera en “Telsel” tienden a estar 1.96 minutos alejados de la
media mientras que, en el “movister”, los tiempos tienden a alejarse sólo 0.11 minutos. Por
esta razón, se pueden explicar las filas en “Telsel” y mayor disgusto de los clientes por el
tiempo de espera.
IPN 76 CECYT-18
Varianza y desviación estándar para datos agrupados
n 1
Donde:
s 2 es la varianza muestral X es la media de la muestra
s es la desviación estándar muestral n es el número de observaciones
xi es el valor de la marca de clase de la muestra
fi es la frecuencia absoluta
f i
50
f xi i (x X ) f
i
2
i
9146 14155.37
IPN 77 CECYT-18
El cálculo de la media del conjunto de datos será: X
__
(f x ) 9146 182.92
i i
f i
50
El valor de la varianza es s
2
(x X ) f
i
2
i
14155.37
288.88s 2
n 1 50 1
s
(x X) f
i
2
i
14155.37
288.89 16.99s
n 1 50 1
Por lo tanto, los tiempos varían respecto a la media en 16.99 segundos en promedio.
IPN 78 CECYT-18
ESTANDARÍZATE 4
10-14 6
15-19 14
20-24 23
25-29 28
30-34 19
35-39 11
40-44 7
2. Dados los siguientes valores: 11, 3, 5, 2, 14, 9, 7, 15, 4, 6, calcula la varianza y la desviación
estándar.
3. El gerente de una empresa de alimentos desea saber qué tanto varían los pesos de los paquetes (en
gramos) de tortillas de nopal, ya que, esta información le permite determinar cuánto es el promedio
de pérdidas causado por el exceso de peso en los paquetes y le da las bases para tomar correctivos
en el proceso de empacado; para ello, selecciona una muestra al azar de paquetes para pesarlos y
registrar el peso.
541 545 543 515 513 518 515 486 489 544
498 520 536 544 527 513 497 527 495 538
a) Si el peso de los paquetes está calculado en 500gr netos, ¿considera que hay pérdida o ganancia
en cuanto a la materia prima? Utilice la estadística descriptiva (gráficos, medidas, etc.) para
argumentar.
IPN 79 CECYT-18
Medidas de forma
Las medidas de forma son indicadores que ofrecen información acerca de cómo los datos se
encuentran contenidos dentro de una distribución y se clasifican en:
La relación que existe entre las medidas de tendencia central y la simetría de una distribución
podemos definirla a través del sesgo y coeficiente de simetría.
Sesgo
El sesgo o asimetría es una medida que indica la simetría de la distribución de una variable
respecto a la media aritmética, sin necesidad de hacer una representación gráfica. Los
coeficientes de asimetría indican si hay el mismo número de elementos a la izquierda o a la
derecha de la media.
IPN 80 CECYT-18
Para determinar la simetría de una distribución, vamos a utilizar el Coeficiente de Fisher
1
Sf
(xi X )3 1
Sf
fi (xi X )3
n s3 n s3
n es el número de datos n es el número de datos
X es la media de la muestra X es la media de la muestra
s es la desviación estándar s es la desviación estándar
xi es cada uno de los datos. xi es la marca de clase.
Ejemplo: Calcula el sesgo para la siguiente distribución que nos representa la estatura (cm)
de algunos niños en edad preescolar. Realice el cálculo como datos no agrupados.
37.71
6.14cm
n 1 14 1
1
Calculamos el coeficiente de fisher: S f
(x i
X )3 1 13.88
0.004
n s 14 (6.14)
3 3
Por lo tanto, como Sf 0 significa que la distribución tiene sesgo positivo con lo que, hay
IPN 81 CECYT-18
EJEMPLO: Los siguientes datos muestran edades de académicos en una determinada
universidad con una muestra de 720 docentes. Determinar la simetría de la distribución
calculando las medidas de tendencia central y calculando el coeficiente de Fisher.
f i
720
f x f (x X) (x X)
i i i i
2
i
3
s
f (x X)
i i
2
140,998.75
14años
n 1 719
1 1
n
fi (xi X )3
720
(805524.28)
Calculamos el coeficiente de Fisher S f 0.41
s3 (14)3
que es mayor que cero. Por lo tanto, como Sf 0 , la distribución tiene sesgo positivo, con
IPN 82 CECYT-18
Si construimos un histograma o un diagrama de caja podemos visualizar el comportamiento
de los datos de manera gráfica.
Curtosis
La curtosis indica cuan amontonados se encuentran los datos en la zona central de una distribución;
es una medida que nos permite medir que tan achatada o puntiaguda es una distribución. Luego, las
distribuciones se clasifican en tres tipos:
IPN 83 CECYT-18
Para determinar el grado de achatamiento de una distribución se utiliza el coeficiente de
apuntamiento de Fisher:
1
Af
(xi X )4
3
1
Af
fi (xi X )4
3
n
s 4
n
s 4
IPN 84 CECYT-18
EJEMPLO: Hallar el coeficiente de apuntamiento de Fisher para las siguientes calificaciones,
obtenidas en un examen de Geometría analítica a un grupo de alumnos, con una escala del 1 al 10:
5 6 4 7 7 7 9 8 9 4 3
Calificación xi _ _
(xi X) 2
(xi X )4
3 (3 6.27)2 10.69 (3 6.27)4 114.33
4 5.15 26.55
4 5.15 26.55
5 1.61 2.60
6 0.07 0.01
7 0.53 0.28
7 0.53 0.28
7 0.53 0.28
8 2.99 8.96
9 7.45 55.55
9 7.45 55.55
Totales _ _
42.18
2.05
n 1 11 1
1
Af
(x X)i
4
1 290.95
3 3 1.50
n s 11 (2.05)
4 4
El resultado corresponde a una distribución platicúrtica, lo cual, puede interpretarse como que
probablemente contiene estudiantes promedio, algunos alumnos más aventajados y seguramente otros
tantos menos atentos
IPN 85 CECYT-18
EJEMPLO: Determina si la siguiente distribución es mesocúrtica, platicúrtica o
leptocúrtica.
f i
720 f x
i i
33270 f (x
i i
X )4 63, 602, 387.56
1 1
n f (x X )
i i
4
(63,602,387.56)
720
Af 3 3 0.700
s4 (14)4
platicúrtica.
IPN 86 CECYT-18
Teorema de Chebyshev
Hemos estudiado anteriormente que una desviación estándar muy pequeña para un conjunto de
valores, indica que estos valores se localizan cerca de la media; por el contrario, si un conjunto de
datos tiene una desviación estándar muy grande, indica que los datos están muy dispersos respecto
a la media.
El matemático ruso P. L. Chebyshev (1821-1894) estableció un teorema que nos permite determinar
la mínima porción de los valores que se encuentran a cierta cantidad de desviaciones
estándares de la media.
Luego, pues, cuando conocemos la media y la desviación estándar de un conjunto de datos podemos
saber aproximadamente el porcentaje de valores que se encuentran alrededor de la media; para ello,
observemos el siguiente diagrama.
IPN 87 CECYT-18
EJEMPLO: Si consideramos las calificaciones del primer departamental de la materia de
probabilidad y estadística de un grupo de 50 alumnos que obtuvieron un promedio de X 70 y una
desviación estándar de s 5 , podemos cuestionarnos ¿Qué porcentaje de los estudiantes obtuvieron
calificaciones entre 60 y 80? y ¿65 y 85?
Sabemos que la media es X 70 y que s 5 , de modo que, debemos resolver la siguiente igualdad
para aproximar el valor de k.
Debemos resolver ambas ecuaciones para un solo valor de k. si el sistema no tiene solución, podemos
aproximarlo.
70 65
Para las calificaciones entre 65 y 85, observemos que 1 indica que 65 está a 1 desviación
5
85 70
estándar por abajo del promedio y que 3 está a 3 desviaciones estándar por arriba de la
5
media. Luego, el intervalo que contiene al rango (65, 85) será para k 3 ; luego, aplicando la regla
1 1
de Chebyshev tenemos que 1 1 2 0.888 lo que significa que cuando menos el 88.8%
k 2
(3)
de los estudiantes deben tener calificaciones entre 65 y 85.
IPN 88 CECYT-18
EJEMPLO. Aplique el teorema de Chebyshev para el siguiente conjunto de datos agrupados.
s
(x X) f
i
2
i
21385.72
13.88 segundos.
n 1 112 1
Aplicando la regla de Chevyshev, tenemos que el 55.6% de los tiempos se encuentra en el intervalo
[X 1.5s , X 1.5s ] [60.36 1.5(13.88), 60.36 1.5(13.88)] [39.54, 81.18] , es decir, el 55.6%
de los empleados se tardan entre 39.54 segundos y 81.18 segundos.
Aplicando la regla de Chevyshev, tenemos que el 75% de los tiempos se encuentra en el intervalo
[X 2s , X 2s ] [60.36 2(13.88),60.36 2(13.88)] [32.60, 88.12] , es decir, el 75% de los
empleados se tardan al menos entre 32.6 segundos y 88.12 segundos.
Aplicando la regla de Chevyshev, tenemos que el 88.9% de los tiempos se encuentra en el intervalo
[X 3s , X 3s ] [60.36 3(13.88), 60.36 3(13.88)] [18.72,102] , es decir, el 88.9% de los
empleados se tardan al menos entre 18.72 segundos y 90, límite superior.
IPN 89 CECYT-18
La regla empírica (Regla 68-95-99.7)
Si una variable está distribuida de forma normal (forma de campana), entonces, a menos de una
desviación estándar s de la media hay aproximadamente el 68% de los datos, a menos de dos
desviaciones estándar de la media hay aproximadamente 95% de los datos y a menos de 3 desviaciones
estándar de la media hay aproximadamente 99.7% de los datos.
EJEMPLO. Una maquina embotelladora llena automáticamente embaces con bebidas de sabores.
Se sabe que la distribución de las botellas se comporta como campana (distribución normal) y que el
contenido promedio de las botellas es de 375ml con una desviación estándar de 4.3ml. Se desea saber
con más exactitud entre qué rangos de llenado están quedando las botellas de sabores.
SOLUCIÓN. El problema nos dice que el llenado tiene un comportamiento normal, de modo que
podemos aplicar la regla empírica para calcular:
Por lo tanto:
IPN 90 CECYT-18
EJEMPLO:
Determine si el conjunto de datos ordenados siguiente que representa las calificaciones de un grupo
de 50 estudiantes de Química IV tiene un comportamiento normal y de ser así, aplique el teorema
de Chevyshev o la regla empírica, según corresponda.
39 58 64 70 72 76 78 85 89 94
44 58 66 70 72 77 80 86 90 95
47 60 67 70 74 77 82 86 90 95
50 63 68 72 74 77 82 88 91 97
55 64 68 72 75 78 83 88 92 98
3728.84 10097.09
IPN 91 CECYT-18
HISTOGRAMA DIAGRAMA DE CAJA
Por lo tanto, al menos el 55.6% de las calificaciones caerán en [53.05 96.10] , es decir, al menos 28
alumnos obtienen calificación dentro del intervalo encontrado.
IPN 92 CECYT-18
ESTANDARÍZATE 5
1. En el cecyt-18 se han registrado los retardos de los trabajadores a través del checador de recursos
humanos. Se emitió un reporte que indicara lo tiempos de retardo, siendo la tolerancia de 1 a 15
minutos.
6 6 7 8 6 7 12 6 6 10 10 6 7 5 5 4 6 5 12 9 9 10 6 9 10 12 9 4 2 5 10 7 7 3 10 7 7 9 6 4 13 7 7 7 11 8
8 11 4 4 5 8 6 6 8 4 7 11 2 6 5 8 3 5 8 8 8 8 12 9 8 7 6 10 8 2 6 8 10 11 8 12 4 8 5 7 7 9 11 7 9 7 8 10
5 10 8 7 10 7
e) Encuentre los valores -1.25s y 1.25s con respecto a la media, ¿Qué porcentaje de los datos se
encuentra en este intervalo?
f) Encuentre los valores -2.75s y 2.75s con respecto a la media, ¿Qué porcentaje de los datos se
encuentra en este intervalo?
g) Encuentre los valores -3s y 3s con respecto a la media, ¿Qué porcentaje de los datos se
encuentra en este intervalo?
h) ¿En qué proporción del tiempo los trabajadores llegan con 10 minutos de retardo o más?
408 358 402 424 372 370 412 389 421 424
416 336 385 410 419 367 423 330 355 379
d) La empresa rechaza la producción si excede la media más 1.5 veces la desviación estándar. Qué
porcentaje de la producción debe ser rechazado, en caso de existir.
IPN 93 CECYT-18
2. PROBABILIDAD
Teoría de conjuntos
Un conjunto es una colección de objetos. A estos objetos les llamaremos elementos del
conjunto. El símbolo “ ” denota pertenencia, es decir, si A es un conjunto y x es un
elemento de A, lo denotaremos por x A . Se lee como: “x pertenece a A, o bien, x
es un elemento del conjunto A”
Siempre que se describen los elementos de un conjunto se encierran entre llaves, del siguiente modo:
{0,1,2,3,4,5,6,7,8,9} ( conjunto de los números del cero hasta el nueve).
PROPIEDADES:
Algunos ejemplos de conjuntos pueden ser: los alumnos de sexto semestre del CECyT-18, los
elementos enlistados de la guardia nacional, etc.
CUANTIFICADORES
Este cuantificador Este cuantificador Crea una Crea una Este conector
universal forma parte universal forma parte sentencia sentencia indica a los
de un lenguaje de un lenguaje verdadera verdadera elementos de un
formal que indica formal que indica siempre que siempre que conjunto que
“para todo”, “cada”, “existe”, “algún”, alguna de las ambas cumplen una
“para cada”, “todo”. “por lo menos uno”, dos premisas premisas se cracterística;
“basta que uno”. o ambas se cumplen. “tal que”, “tales
cumplen. (A B ) que”.
(A B )
IPN 94 CECYT-18
Podemos determinar un conjunto de las siguientes maneras:
Dando una lista de los objetos o Dando la condicion o las condiciones que
elementos que lo forman (por deben cumplir sus elementos (por
extensión) comprensión)
A {0,1,2,3, 4,5,6,7,8,9} {x | p(x)} o {x : p(x )}
PROPIEDADES:
Ejemplo: Si A=Conjunto de todas las aves, B= Conjunto de todos los animales con alas y C=
Conjunto de todos los animales que vuelan. Entonces, A B , B A , B C , C B .
IPN 95 CECYT-18
El conjunto universal es el conjunto que consta de todos los elementos a los que se
puede referir una situación en particular y se designa con el símbolo U .
PROPIEDADES:
1. El conjunto universal no es único; depende del problema que se estudia y puede cambiar
según la situación que se esté tratando.
2. Para un mismo problema, el conjunto universal no está definido en forma única; podemos
elegirlo a nuestra conveniencia.
De cada uno de estos conjuntos universales podemos estudiar características que sean de nuestro
interés, por ejemplo, dentro del conjunto universal de los número reales, podemos estudiar aquellos
elementos que sean solución de la ecuacion x 2x 3 0 . Del conjunto universal de todos los
2
estudiantes del Cecyt-18 podemos estudiar caracteríticas como alumnos regulares, alumnos por
semestre académico, etc.; del conjunto universal de los números pares podemos estudiar a todos
aquellos que son divisibles por 4, entre otras caracteríticas.
PROPIEDADES:
IPN 96 CECYT-18
Operaciones con conjuntos
PROPIEDADES:
1. A A
2. A U U A (A B)
3. A A A
6. A y B
B (A B)
4. A B B A Conmutativa
7. A B A B B
5. A (B C ) (A B) C Asociativa
8. Si A B (A ) (B )
IPN 97 CECYT-18
Considere los conjuntos:
Ejemplo 1 Ejemplo 2
A {1,3,5,7,9} A {x | x 2 4 0}
B {2,4,5,6,8} B {1,3,6}
A B {1,2,3,4,5,6,7,8,9} A B {2,1,2,3,6}
Ejemplo 3
Consideremos al conjunto U {} y sean los conjuntos A {x : x 2 3x 2 0} ,
B {x : x 3 4x } y C {x : 0 x 4} . Encuentre:
a. A B
b. B C
c. A B C
Además, represente al universo U y a los conjuntos en un diagrama de Venn.
Por lo tanto:
a. A B {2,1,0, 2}
b. B C {0,2, 2,1,3}
c. A B C {2,1,0, 2,3}
a) A B
b) B C
c) AC
A B {a,b,c, f , g, h, i, j }
B C {c, f , g, h, i, j, k, l , m}
A C {a,b,c, i, j, k, l , m, n}
IPN 98 CECYT-18
La intersección de dos conjuntos denotada por A B {x | x A x B} . A
intersección B está formado por los elementos que están en A y que están en B al
mismo tiempo. Se verifica que x, x (A B) x A x B . El operador “ ”
significa “y”, es decir, el elemento “x” pertenece a la intersección de los conjunto A y
B si éste se encuentra en el conjunto A y en el conjunto B.
PROPIEDADES:
(A B) A
1. A 6. A y B
(A B) B
2. A U A
7. A B A B A
3. A A A
A (B C) (A B) (A C)
4. A B B A Conmutativa 8.
5. (A B) C A (B C ) Asociativa A (B C) (A B) (A C)
Distributivas
Ejemplo 1 Ejemplo 2
A {1,3,5,7,9} A {x | x 2 4 0}
B {2,4,5,6,8} B {1,3,6}
A B {5} A B {}
Ejemplo 3
Sean A B {2}
A {1, 2, 3, 4, 5}, B {x | x x 6 0} {3, 2}
2
A C {2, 3}
C {x | x 3 4x 2 x 6 0} {1, 2, 3} A B C {2}
IPN 99 CECYT-18
El complemento de un conjunto A denotado por A ' , es el conjunto de los elementos
x que pertenecen al conjunto universal U pero que no pertencen a A.
Se verifica que A ' {x | x U x A}
Ejemplo 1 Ejemplo 2
Sea U {a,e, i ,o, u} , luego U {1,2,3,4,5,6,7,8,9} , luego
Ejemplo 3
PROPIEDADES
1. A A ' U 4. ' U
2. A A ' 5. (A')' A
3. U ' 6. A B B ' A '
PROPIEDADES:
1. A B A B' 6. (A B) A
2. A A 7. A B (A B) B A (A B)
3. AA 8. B (A B)
4. A (B C ) (A B) (A C ) 9. A B A B
5. A
Ejemplo 1 Ejemplo 2
A {1,3,5,7,9} A {x | x 2 4 0}
B {2,4,5,6,8} B {1,3,6}
A B {1,3,7,9} A B {2,2}
A B A B' B A B A'
Demostración Demostración
AB AB
x, x A x B x, x B x A
x A x B' x B x A'
x (A B ') x (B A')
Ejemplo 1 Ejemplo 2
A {1,3,5,7,9} A {x | x 2 4 0}
B {2,4,5,6,8} B {1,3,6}
AB (A B) (B A) AB (A B) (B A)
{1,2,3,4,6,7,8,9} {2,1,2,3,6}
PROPIEDADES:
1. AB (A B) (B A) 5. A A
2. (AB)C A(BC) Asociativa 6. A (BC ) (A B)(A C ) Distributiva
3. AB B A Conmutativa 7. (AB) (BC ) (A B C ) (A B C )
4. A A
Ejemplo 2: Sean C {3, 4,3,8} y sea B {3, 4, 4,8} , entonces, A B, es decir,
{3,4,3,8} {3,4,4,8} . Advierta que un conjunto no cambia si se repiten sus elementos.
IDEMPOTENCIA CONMUTATIVA
AA A A B B A
AA A A B B A
ASOCIATIVA DISTRIBUTIVAS
(A B ) C A (B C ) A (B C ) (A B ) (A C )
(A B ) C A (B C ) A (B C ) (A B ) (A C )
A A' U A (A B ) A
A A' A (A B ) A
(A ')' A A (A ' B ) A B
U' A (A ' B ) A B
A Propiedades de la unión
ESTANDARÍZATE 6
1. A es el conjunto de todos los números reales 2. B es el conjunto de todos los números reales
mayores que 32 mayores que 8 pero menores que 71
M {x | x es un cuadrilátero}
N {x | x es un rectángulo}
O {x | x es un rombo}
P {x | x es un cuadrado}
6.- Dados los conjuntos A {4,6, 8} , B {9, 4,8} , C {6,4,8} y D {4,6} , ¿Cuáles de las
siguientes afirmaciones son verdaderas?
A B 6B {3,4} C
7B D A D
5B B A
A C A C C A
B C B C B A
10.- Dados los conjuntos U {m, n,o, p,q} , A {m, n, p} y B {n, p, q} . Calcula
AB A B'
B A A ' B
B A A ' B '
(A B)' (B A)'
A (B C ) (A B) (A C )
A (B C ) (A B) (A C )
A {x | (x 2 8x 15)(x 1) 0} Sol.
B {x | x 2 8x 15 0} Sol.
C {x | x 2 2} Sol.
13.- Considere el conjunto universal U {} {..., 2, 1,0,1,2,...} , encuentre los conjuntos que
definen las siguientes condiciones:
A {x | (x 2 8x 15)(x 1) 0} Sol.
B {x | x 2 8x 15 0} Sol.
C {x | x 2 2} Sol.
b. S R
c
a. R S c. R S d. S R
b. S R
'
a. R S c. R S d. S R
a. A
c
b. U c. (A B )c d. B
c
e. (AB)c
Si consideramos, por ejemplo, el conjunto con los elementos A {a,e, i,o, u} , analicemos que tiene 5
elementos, de modo que la cardinalidad del conjunto es N(A) 5 ya que está formado por 5
elementos.
Si consideramos el conjunto dado por B {} , entonces, la cardinalidad del conjunto será N(B) 0
Sean: Calcular:
A {1,2,3,4,5} N (A) 5
B {2,4,6,8,10} N (B ) 5
N (A B ) 3
N (AB ) 6
Si mostramos los elementos del conjunto potencia o bien, todos los subconjuntos del conjunto
dado, estos son P(A) {,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}} .
Es posible determinar la cardinalidad de cualquier conjunto de elementos u objetos los cuales sean
contables mediante operaciones de cardinalidad.
Ejemplo: En el grupo 5IM7 de la carrera de químico laboratorista de cecy-t 18, hay 45 alumnos, a
20 alumnos les gusta la materia de cálculo diferencial, a 30 les gusta la materia de probabilidad y
estadística y a 10 les gustan ambas asignaturas. Determine (C P)' .
N (C P ) N (C ) N (P ) N (C P )
20 30 10
40
N (A B) N (A) N(B) N (A B)
N(A B C ) N(A) N (B) N(C ) N (A B) N(B C ) N(C A) N (A B C )
N(A B) N(A B) N(A B) N (B A)
N (A) N (A B) N (A B)
Ejemplo: De los alumnos de sexto semestre, los cuales son 65, a 40 de ellos les gusta dibujo técnico,
a 30 les gusta geometría analítica y a 10 de ellos les gustan ambas materias. Responda:
a. A los alumnos que les gusta al menos una materia deben pertenecer a la union de los
conjuntos, es decir, N(G D) 60 alumnos.
b. A los alumnos que les gusta únicamente la geometría y trigonometría deben pertenecer a la
diferencia N (G D) 20 alumnos.
c. A los alumnos que les gusta únicamente una de las dos materias deben estar en la diferencia
simétrica, es decir, N (GD) N (G D) N(D G) 20 30 50 alumnos.
d. A los alumnos que no les gusta ninguna de las dos materias deben estar en el complemento
de la union de G y D, es decir, N(G D)' 5 alumnos.
Ejemplo: En la carrera de técnico en sistemas se realizó una encuesta a 200 estudiantes para saber
qué lenguaje de programación preferían aprender al inicio del semestre, se encontró que:
50 estudiantes prefieren lenguaje C, 65 estudiantes prefieren C++, 77 estudiantes prefieren Java, 100
estudiantes prefieren C o C++, 105 estudiantes prefieren C++ o Java, 110 estudiantes prefieren C
o Java, 10 estudiantes prefieren C y Java pero no C++.
Determine la cardinalidad de (C C J ) , es decir, los estudiantes que prefieren estudiar los tres
lenguajes de programación y la cantidad de esudiantes que si les gusta C y C++ pero no Java;
además, determine N(C J ') , N(C 'C J ') y N ((C C ) J ')
N (C J ) N (C ) N (J ) N (C J )
110 50 77 N (C J )
N (C J ) 17
N (C J ) N (C ) N (J ) N (C J )
105 65 77 N (C J )
N (C J ) 37
N (C C ) N (C ) N (C ) N (C C )
100 50 65 N (C J )
N (C J ) 15
Para crearnos una idea de lo que estamos haciendo, lo hacemos a través del siguiente diagrama de
Venn:
ESTANDARÍZATE 7
1.- Determine el porcentaje de alumnos que practican futbol y basquetbol si al entrevistar a 1000
estudiantes se obtuvieron las siguientes respuestas: 500 estudiantes practican futbol, 600 estudiantes
practican basquetbol y 150 estudiantes no practican ni futbol ni basquetbol.
3.- Se realizó una encuesta a 150 personas para conocer cuál es su flor favorita, obteniéndose los
siguientes resultados: 40 personas prefieren las rosas, 55 prefieren los claveles, 67 prefieren las
geranios, 80 prefieren las rosas o los claveles, 95 prefieren los claveles o los geranios, 90 prefieren ls
rosas o los geranios y 10 prefieren las rosas y los geranios pero no los claveles. Construye un diagrama
de Venn y responde lo siguiente:
5.- Un estudio desarrollado con 30 personas sobre su preferencia por una mascota, arroja los siguientes
datos: 16 personas prefieren los perros, 12 prefieren los gatos y 7 prefieren los peces. Además, 5
personas prefieren los perros y los gatos, 3 prefieren los perros y los peces, 2 prefieren los gatos y los
peces y 2 personas prefieren las tres mascotas.
b) ¿Cuántas personas prefieren los perros o los gatos pero no los peces?
c) ¿Cuántas personas prefieren los gatos y los peces pero no los perros?
N (U ) 44 N(B C ) 12
N(A C ) 14 N[(A B C )'] 6
N(A B C ) 5 N (B) 17
N (A) 21 N (A B C ') 3
Técnicas de conteo
Se lanzan 3 monedas al aire, ¿De cuántas formas diferentes pueden caer una vez
lanzadas?
Sello
Sello
Águila
Sello
Sello
Águila
Águila
Sello
Sello
Águila
Águila
Sello
Águila
Águila
Por lo tanto, tenemos 2 2 2 8 posibiles resultados, que si los colocamos en una tabla, tendriamos:
Jacobo desea ir a visitar a sus padres a la ciudad de “Río grande” este fin de semana
y, para ello, debe cruzar dos ciudades: Calera y fresnillo, para llegar finalmente a su ciudad natal.
Para ir de calera a fresnillo, Jacobo tiene tres caminos para llegar y, posteriormente para llegar a
Río grande, cuenta con cuatro ; entonces, ¿De cuántas formas distintas puede llegar Jacobo a la
ciudad de Río grande?
Consideremos pues, que, de la ciudad de calera a fresnillo, se tienen tres posibilidades y, una vez
que Jacobo ha llegado a fresnillo, cuenta con cuatro opciones para llegar a Río grande; así, tendrá
3 4 12 posibilidades para llegar a Río grande.
Calculamos la cantidad de arreglos florales que la florería “Víctor” puede ofrecer a través de un
diagrama de árbol:
R1 R2 R3
M1 M2 M3 M1 M2 M3 M1 M2 M3
G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2
Luego, la florería Víctor, ofrecerá a los estudiantes 3 3 2 18 posibles arreglos florales a escoger.
El grupo 6IM1 está formado por 23 hombres y 16 mujeres, ¿De cuántas formas puede
elegirse un jefe de grupo y un sub-jefe de grupo?
Consideremos entonces que, para la elección del jefe de grupo y sub-jefe de grupo no se especifica si
puede ser la misma persona, entonces, consideraremos los dos casos.
CASO 1: (El jefe de grupo y el sub-jefe de grupo pueden ser la misma persona) Hay 37 posibilidades
distintas para ocupar el puesto de jefe de grupo y 37 posibilidades para ocupar el puesto de sub-jefe
de grupo; entonces tenemos 37 37 1369 formas de elegir a los respresentantes del grupo.
CASO 2: (El jefe de grupo y el sub-jefe de grupo NO pueden ser la misma persona) el jefe de grupo
se elegirá de entre las 37 posibilidades que hay en el grupo y posteriormente, el sub-jefe de grupo se
elegira de entre 36 posibilidades, de modo que, hay 37 36 1332 posibilidades de elegir a los
representanes del grupo.
Consideremos entonces que un número par de cuatro cifras significativas cumple las siguientes
condiciones:
Luego, por el principio del producto tenemos que se pueden formar 10 10 10 5 5000 números
páres de cuatro cifras mayores o iguales a 1000.
ESTANDARÍZATE 8
1. Se lanzan al aire tres dados, ¿De cuántas 2. Un restaurante ofrece 6 sopas, 8 guisados y 3
maneras diferentes pueden caer? postres, todos distintos. ¿Cuántos menús
diferentes podemos tener si debe tener solo un
elemento de cada tipo?
3. Las placas en Zacatecas constan de 3 letras, 4. Vuelos “Osornio”, tiene programados 7 vuelos
3 números y 1 letra, en ese orden, ¿Cuántas diarios de la ciudad de Zacatecas a México y
placas distintas se pueden hacer? Considere el cinco vuelos de México a Cancún, ¿Cuántas
Abecedario de 26 letras para cada sección de la opciones de vuelo distintas ofrece la aerolínea
placa y los números del 0-9. Sólo las letras se para viajar de Zacatecas a Cancún?
pueden repetir.
7. Determinar la cantidad de números de dos 8. En la sala de juntas del cecyt-18 habrá una
dígitos que se pueden obtener, si se permite la junta con los encargados de proyecto aula. La
repetición, con los números 5, 6, 7, 8, 9. mesa central tiene forma de U. En esta reunión
estarán 6 hombres y 4 mujeres. Determinar de
cuantas formas se pueden acomodar en la sala.
Para el A) tenemos que la única forma de ordenar al número 1 es una sola vez (una forma).
Para el B) tenemos que las formas de ordenar a los números 1 y 2 son: 12, 21 (dos formas).
Para el C) tenemos que las formas de ordenar a los números 1, 2 y 3 son: 3 2 1 6 formas.
2 3
1
3 2
1 3
2
3 1
1 2
3
2 1
De esta forma podemos observar que, si tuviéramos cinco números, tendríamos 5 4 3 2 1 120
formas distintas de ordenarlos. Definimos de esta forma a ésta operación como el factorial de un
número.
1 2 3 (n 1) n si n0
n!
1 si n0
Algunos ejemplos del uso del factorial de un número pueden ser los siguientes:
Calcular las permutaciones y las combinaciones que se pueden obtener con las tres
letras ABC.
PERMUTACIONES COMBINACIONES
ABC ABC
ACB
BAC
BCA
CBA
CAB
Observe en este caso que, cada permutación de las letras ABC es distinta, es decir, cada palabra
formada al permutar las letras ABC es diferente.
Además, en el caso de las combinaciones, el orden no importa y por ello se tiene sólo un resultado.
Los resultados ABC, ACB, BAC, BCA, CBA, CAB son iguales cuando se habla de combinaciones
y son diferentes cuando se habla de permutaciones.
Combinaciones
Una Combinación son todos los agrupamientos que se pueden hacer con n
elementos de un conjunto, tomando r de ellos a la vez y teniendo en cuenta que
r n . Se determina por
n!
Crn “Combinaciones de n en r”
r !(n r )!
Analice que en la bolsa se tienen un número total de 5 canicas de las cuales no nos importa el orden
en que se saquen, por tanto, se tienen 5 elementos y se requiere sacar dos de ellos.
n! 5!
Aplicando nuestro resultado anterior, tenemos que hay C rn 10 formas.
r !(n - r )! 2 !(5 - 2)!
N2 N1 N1 N1 N1
B1 B1 N2 N2 N2
N1 N2 B1 B2 A
B2 B2 B2 B1 B1
A A A A B2
Para dictar la conferencia se tiene un total de 5 especialistas y se requiere sacar 3 de ellos, de los
cuales, 2 deben ser expertos en integral y uno en diferencial. Entonces, para el primer caso tendremos
un total de 3 elementos y se requieren 2 de ellos y un segundo caso, tenemos un total de 2 elementos
n! 3!
y se requiere 1 de ellos, entonces, C 23 3 formas de elegirlos y para cada una
r !(n - r )! 2 !(3 2)!
n! 2!
de ellas tenemos ahora C 12 2 . Por lo tanto para elegir a los conferencistas,
r !(n - r )! 1!(2 1)!
tenemos 3 2 6 formas distintas de elegirlos.
En el grupo 6IM1 hay 28 estudiantes y se van a entregar 4 premios a los mejores promedios sin
importar el orden; por lo tanto, podemos aplicar la fórmula de combinaciones sin repetición, es decir,
n! 28 !
tenemos que los premios se pueden repartir de C 428 20, 475 formas
r !(n - r )! 4 !(28 4)!
distintas.
Permutaciones
Para ilustrar el uso de las fórmulas para calcular permutaciones, analicemos los siguientes ejemplos:
Realicemos el análisis combinatorio. Tenemos 4 colores diferentes y vamos a escoger dos, entonces,
n=4 y r=2, con lo que sustituimos en la expresión:
C1 C2 C3 C4
C2 C3 C4 C1 C3 C4 C1 C2 C4 C1 C2 C3
n! 4! 4! 2! 3 4
P24 P24 3 4 12 maneras de confeccionar el traje.
(n r )! (4 2)! 2! 2!
Observe que, los arreglos posibles son permutaciones, pues, el orden en cada uno sí es de interés.
Determinemos el número de permutaciones que se generan, de modo que hay
5! 5!
a) Observe que, para los arreglos (permutaciones), hay P3
5
60 posibles palabras.
(5 3)! 2!
b) Podemos resolverlo utilizando tambien diagramas de árbol, que en este caso sería:
c) Consideremos un arreglo de la forma: ___ ___ ___ donde en la primera línea puede ir
cualquiera de las cinco letras; en la segunda casilla nos quedan 4 letras disponibles y así
sucesivamente, de modo que tenemos 5 4 3 60 arreglos distintos con las letras de la palabra
FRIDA.
Analicemos que el problema resalta el orden en el que se colocan los libros, ya que, los de la misma
materia deben estar juntos; así, en el primer caso tendremos un total de 5 libros y en el segundo un
total de 6.
Así la solución al problema sobre las formas en las que se pueden ordenar los libros en la estantería
5! 6! 5! 6!
con las condiciones dadas será de P55 P66 86, 400 , o bien,
(5 5)! (6 6)! 1 1
P55 P66 (5!)(6!) 86,400 formas distintas considerando que primero colocamos los de cálculo
diferencial y posteriormente los de cáculo integral; de modo que, debemos considerar tambien los
arreglos si colocamos primero los de cálculo integral y posteriormente los de cálculo diferencial; así,
tenemos 86,400 2 172,800 formas de ordenarlos.
n ,n2 ,...,nk n!
PRn 1
n1 ! n2 ! ... nk !
Para ilustrar el uso de las permutaciones con elementos que se repiten consideremos el siguiente
ejemplo:
Si consideramos al conjunto de las letras de palabra MEME como si todas fueran diferentes, entonces,
tendríamos lo siguiente:
En la tabla, cada cuatro palabras se repiten o bien, equivalen a una palabra, entonces, tenemos un
total de 24 6 palabras para este caso.
4
4!
Haciendo uso ahora de la fórmula para permutaciones con repetición tendremos PR4
2,2
6
2! 2!
palabras.
Maziel tiene un estuche para resistencias, el cual contiene, dos resistencias con raya
color verde, tres con raya color café y cuatro con raya color blanco. ¿De cuántas formas diferentes
puede Maziel ordenarlas en un proto para la clase de circuitos electrónicos?
Sean n1 2 resistencias con raya verde, n2 3 resistencias con raya café y n3 4 resistencias con
raya blanca; además, n n 1 n 2 n 3 9 resistencias en total. Para encontrar la cantidad de
n ,n2 ,...,nk n!
PRn 1
n1 ! n2 ! ... nk !
permutaciones o arreglos que maziel puede lograr, tenemos que:
9! 362, 880
PR92,3,4 1, 260
2! 3! 4! 288
arreglos para las resistencias.
Vamos a considerar la cantidad de veces que se repite cada una de las letras de la palabra
POLITECNICO, es decir:
Una vez que tenemos el conteo, podemos calcular el número de permutaciones en que
podemos ordenar la palabra POLITECNICO, que serán:
11! 39916800
PR111,2,1,2,1,1,2,1 4,989,600 formas de
(1!)(2!)(1!)(2!)(1!)(1!)(2!)(1!) 8
ordenar las letras.
Para determinar en cuantas ocasiones las C quedan juntas debemos considerar a las
dos como una sola letra, por tanto, tenemos que:
10! 3,628,800
PR101,2,1,2,1,1,1,1 907,200 formas de ordenar
1! 2! 1! 2! 1! 1! 1! 1! 4
las letras.
ene
Una Permutación circular (sin repetición). Se llama permutación circular (sin
repetición) de n elementos, que denotamos por PC n , a los distintos grupos que se
pueden formar, de tal manera que en cada grupo entre los n elementos se diferencie
de los demás en la posición relativa. De este modo se tiene que:
PC nn (n 1)!
La definición nos explica que podemos utilizar la permutación circular cuando los elementos deben
ordenarse en círculo, además debemos tomar en cuenta que:
1. El orden importa
2. Los elementos se ordenan en circulo
3. Todos los elementos se toman en cuenta.
¿De cuantas formas diferentes se pueden sentar 3 personas en línea recta y en circulo?
Para ordenar a las tres personas en Para ordenar a las tres personas círculo
linea recta nos da como posibilidades nos da como posibilidades
n ! (n )(n 1)!
(n 1)!
n n
En primer lugar, vamos a mostrar algunos posibles ordenamientos para darnos una idea de la
situacion, es decir:
Observando que P1 y P2 son la pareja que siempre van a querer estar juntos, podemos considerarlos
como un solo elemento, es decir, haciendo uso de las permutaciones circulares sin repetición tenemos
PC 6 (6 1)! 5 ! 120 formas distintas de sentarse alrededor de la fogata si consideramos a la
pareja como un solo elemento, pero debemos considerar que se hizo el cálculo sin considerar lo
siguiente:
Lo que ilustra la imagen es que, en un caso se sentaron la pareja P1 y P2 en este orden pero hemos
olvidado que tambien se cumple si se sientan como P2 y P1 . Por lo tanto, la cantidad de formas en
las que se pueden sentar los siete amigos considerando a la pareja siempre juntos estará determinada
por PC 6 (6 1)! 5 ! 120 2 240 (observe que son las permutaciones para 5 elementos
multiplicadas por las permutaciones para dos elementos). Por lo tanto, hay 240 fomas distintas de
sentarse alrededor de la fogata.
1. ¿De cuántas maneras tres parejas de esposos se 2. El grupo 6IM4 desea hacer una rifa para
pueden ubicar en una mesa circular para jugar sacar fondos para su graduacion, para ello
dados, si estas parejas juegan siempre juntas? deciden hacer boletos donde cada boleto
consta de un número de 4 cifras. Para generar
cada número participante se utilizaron los
digitos del cero al nueve, ¿Cuántos boletos
pueden hacer para la rifa sin repetirse ninguno
de los números?
5. Se deben colocar 5 hombres y 4 mujeres en fila 6. ¿De cuántas maneras diferentes se pueden
de modo que las mujeres ocupen los lugares pares, sentar 7 personas en una mesa redonda, si una
¿de cuántas maneras puede hacerse? persona se sienta al centro y las otras 6 a su
alrededor?
9. Encontrar de cuantas formas diferentes se 10. ¿Cuántas banderas tricolor se pueden formar
pueden acomodar 3 donas de chocolate, 4 con tres franjas de tela, una roja, una azul y otra
glaseadas y dos de cajeta en una caja, con amarilla, pudiéndose repetir los colores, pero sin
capacidad para nueve piezas. poner dos bandas consecutivas del mismo color?
11. Un dado es tirado 5 veces. Considerando el 12. ¿Cuántas claves para acceder a una
orden de los tiros, ¿de cuántas maneras pueden computadora se pueden obtener con los números
ocurrir 2 números 2, un número 3, 1 número 4 y 2, 2, 2, 3, 5, 5, 5, 5, 5?, ¿Cuántas de las claves
1 número 6? anteriores empiezan por un 2 seguido de un tres?
13. El equipo de Volibol femenil de cecyt-18 14. Obtenga todas las permutaciones posibles
participa 9 juegos esta temporada, ¿cuántas que se pueden obtener con las letras de la
maneras hay de que en estos 9 juegos en los que palabra AMA y descríbalas de forma explícita.
participan, obtengan 4 victorias, 3 empates y ¿En cuántas de ellas las letras A aparecen
dos juegos perdidos? juntas?
La teoría de probabilidades tiene sus inicios por el año de 1654 en relación a problemas relacionados
con los juegos de azar.
La teoría de la probabilidad se encarga de asignarle un cierto valor a cada posible resultado que
pueda suceder en un experimento aleatorio, con la finalidad de cuantificar los resultados y, con ello,
saber si un suceso es más probable que otro. Por ejemplo:
Imagine que lanzamos dos dados y registramos la suma de los puntos obtenidos, ¿Cuál es la
probabilidad de que se obtenga una suma mayor a 8?
Imagine que lazamos una moneda 3 veces y nos preguntamos ¿Cuál es la probabilidad de
obtener al menos 2 águilas?
Imagine que una familia tiene tres hijos, ¿Cuál es la probabilidad de que al menos dos sean
mujeres?
Todos estos ejemplos nos dan razón de ese valor que podemos asignarle a cada posible resultado de
un determinado experimento aleatorio y con ello calcular su probabilidad.
Si elegimos al azar 30 personas y las encuestamos sobre su preferencia por alguna bebida
saborizada en particular, el resultado de este ensayo es un experimento aleatorio.
Si lanzamos 20 veces un dado y anotamos el número que aparece cada vez en la parte superior,
el resultado es un experimento aleatorio.
Seleccionar un producto elaborado por una empresa para hacer un control de calidad, etc.
Lanzar una moneda una vez, entonces, el espacio muestral será S {A, S}
Arrojar una moneda dos veces, entonces, el espacio muestral será
S {(A, S),(A, A),(S, A),(S, S)}
Una familia tiene tres hijos, entonces, el espacio muestral determinado por el sexo de los hijos
está dado por S {MMM, HHM, HMH , HMM, MHH , MHM, MMH , MMM}
Como un evento o suceso es un conjunto, valen las mismas relaciones que en la teoría de conjuntos,
es decir, si por ejemplo, los conjuntos A, B y C son eventos del Universo, entonces, los conjuntos
Ac , A B , Ac B , etc, tambien son eventos del universo y tienen una interpretación. Algunas
interpretaciones sobre sucesos o eventos son las siguientes:
“Ocurre el suceso A” A
La teoría de probabilidades bajo el enfoque clásico se basa principalmente en el supuesto de que cada
resultado es igualmente probable en su ocurrencia. Este enfoque descansa sobre las siguientes
condiciones:
Algunas notaciones importantes que vamos a necesitar para el estudio de la probabilidad son las
siguientes:
a. n(S) al número total de elementos del espacio muestral, o bien, es el número total de
eventos simples distintos posibles al realizar un experimento.
b. n(A) denota el número total de formas distintas en que A puede ocurrir.
Nuestro espacio muestral es S {1,2,3,4,5,6} y todos los resultados son igualmente probables.
Además, A puede ocurrir de una sola forma (obtener un 3), por lo tanto, n(A) 1 y n(S) 6 ,
n(A) 1
entonces, la probabiliad de obtener un 3 al lanzar un dado es de P(A) 0.166
n(S ) 6
B. Utilizando la teoría de las probabilidades clásica, tenemos que A es el evento de obtener un número
impar al lanzar el dado al azar.
Nuestro espacio muestral es S {1,2,3,4,5,6} y todos los resultados son igualmente probables.
Además, A puede ocurrir de tres formas distintas (Obtener un 1, 3, 5), por lo tanto, n(A) 3 y
n(S) 6 , entonces, la probabiliad de obtener un número impar al lanzar un dado es de
n(A) 3
P(A) 0.5
n(S ) 6
Determine la probabilidad de que exactamente dos de los tres hijos de una pareja
sean varones. Suponga que es igualmente probable dar a luz a un niño que, a una niña y, que el
género de cualquier hijo no influye en el género del otro.
Utilizando la teoría de las probabilidades clásica, tenemos que A es el evento de obtener exactamente
dos varones.
Otro enfoque para definir probabilidades es el enfoque frecuencial o empírico. Considere por ejemplo:
cuando se trata de determinar cuál es la probabiliad de que un automovil tenga un accidente en un
año, se deben analizar resultados de años previos para determinar el número de automóviles en uso
durante un año, y el número de estos que se accidentaron. Despues, se calcula la razón entre el
número de automoviles que sufrieron un accidente y la cantidad total de automoviles .
Si queremos conocer la probabilidad del evento A según este enfoque realizamos el experimento un
gran número de veces y contamos cuántas veces ocurre A. Con base en estos resultados, P(A) se
estima de la siguiente forma:
Para responder a cada uno de los incisos, consideremos que no concemos el número de monedas de
cada cantidad existentes en la urna, por lo que, no podemos utilizar la probabilidad clásica para
encontrar la probabilidad de cada evento posible. Entonces,
b. El evento menos probable en este caso, será el de menor frecuencia, es decir, B= “evento
menos posible” que sería sacar la moneda de $1 con la siguiente probabilidad:
5 1
P(B) 0.1
50 10
c. Sea C= “evento más probable”. El evento que debemos predecir en este caso es el evento con
una mayor frecuencia, es decir, sacar una moneda de $2 con una probabilidad de:
18
P(C) 0.36
50
Observe que al calcular probabilidades con el método de frecuencias relativas obtenemos una
aproximación en vez de un valor exacto. A mayor número de veces que repitamos el experimento,
más cerca estará la probabilidad del valor real.
Estos se forman combinando dos o más eventos simples. Haciendo uso de la notación de conjuntos
nos introducimos a su estudio de la siguiente forma:
5
Luego la probabiliadad P(CE BA) 0.5
10
2
P(CE BA) 0.2
10
Analicemos que, de las 30 personas, 7 son niños y, por lo tanto, 23 no son niños, de modo que, la
probabilidad de elegir a una persona y esta no sea niño es lo mismo que
23
P(niñoc ) 0.767
30
7
P(niñoc ) 1 P(niño) 1 1 0.233 0.767
30
c. A d. B
c c
a. A B b. A B
En este caso vamos a construir un diagrama de Venn que nos ilustre la situación para poder calcular
las probabilidades que nos solicitan; luego, observemos:
7
a. P(A B) 0.777
9
3
b. P(A B) 0.333
9
4
c. Ac {1, 4, 6, 8} , por tanto, P(A ) 0.444
c
2
d. (A B )c {6, 8} , por tanto, P((A B) ) 0.222
c
6
e. Ac B c {1, 3, 4, 6, 8, 9} , por tanto, P(A B ) 0.667
c c
a. P (A B ) b. P (A B ') c. P(B )
c
d. P(A )
c
En este caso vamos a construir un diagrama de Venn que nos ilustre la situación para poder calcular
las probabilidades; observemos que P(A) 0.3 , P(B ) 0.4 y P(A B) 0.1 . Señale tambien que
P(S) 1
b. P (A B c ) 0.2
Para ilustrar la definición anterior considere, por ejemplo, sea U {1,2,3,4,5,6} y sean A {2, 4,6}
y sea B {1,3,5} . Por lo tanto AB son disjuntos.
A= “Se obtiene un 7”
B= “Se obtiene un 11”
Creamos las posibilidades para cada uno de los casos, para ello utilizamos un diagrama de árbol.
1 2 3
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
7 7 7
4 5 6
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
7 7 11 7 11
Observe que se tienen un total de 66 36 formas de obtener un resultado en nuestro espacio
muestral S . Para obtener como respuesta 11, tenemos dos posibilidades y para el caso de obtener
un 7, tenemos 6 posibilidades. Observe que se trata de eventos mutuamente excluyentes
pues un total de 7 y 11 no puede ocurrir en el mismo lanzamiento.
P= “Aprobar probabilidad”
R= “Aprobar redes”
2 4 1 31
P(P R) P(P) P(R) P(P R) 0.8611
3 9 4 36
4 1 7
P(R P) P(R) P(R P) 0.1944
9 4 36
c) La probabilidad de que apruebe únicamente uno de los dos cursos está dada por:
Nuestro espacio muestral está formado por todas las formas de elegir cinco representantes, lo cual,
nos lleva al cálculo de combinaciones de 20 personas tomadas de cinco a la vez; entonces, el número
12!
a. Las formas distintas de elegir a tres mujeres de 12, está dada por C3
12
220 formas.
3!(12 3)!
Para elegir a dos hombres para completar la mesa directiva, lo hacemos a través de
8!
C 28 28 ; así, tenemos que:
2!(8 2)!
b. Para encontrar la probabilidad de que al menos 3 de los cinco representantes de la mesa directiva
sean mujeres debemos calcular las posibilidades para 3, 4 y 5 mujeres, es decir:
12! 8!
Si hay 3 mujeres tenemos C3
12
220 y dos hombres; entonces, C28 28
3!(12 3)! 2!(8 2)!
12!
Si hay 4 mujeres tenemos que C 4
12
495 y habrá 1 hombre; entonces,
4!(12 4)!
8!
C18 8
1!(8 1)!
12!
Si hay 5 mujeres tenemos que C5
12
792 y habrá 0 hombres; entonces,
5!(12 5)!
8!
C 08 1
0!(8 0)!
Luego, la probabilidad de que al menos 3 de los cinco representantes de la mesa directiva sean
mujeres estará dada por:
P(A) P(A') 1
P(A') 1 P(A)
P(A) 1 P(A')
Si las probabilidades de que un mecánico automotríz dé servicio a tres, cuatro, cinco, seis, siete, ocho
o más vehículos en un día de trabajo son de 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07, respectivamente, ¿Cuál
es la probabilidad de que dé servicio al menos a cuatro autos el siguiente día de trabajo?
Declaramos el evento:
Tenemos que P(A') es la probabilidad de que exactamente tres vehículos reciban servicio, es decir,
P(A ') 0.12
Por la definición anterior, tenemos que P(A) 1 P(A') 1 0.12 0.88 , es decir, la probabilidad
de que al menos cuatro vehículos reciban servicio automotriz el siguiente día.
Se les aplica un examen a 40 estudiantes que aspiran a entrar a alguna carrera de nivel
superior. La siguiente tabla muestra los resultados obtenidos por género.
Masculino Femenino
Aprobó 7 2 9
No aprobó 18 13 31
25 15 40
a. Utilizando la regla de la suma, tenemos que la probabilidad de que el estudiante sea hombre o
25 9 7
aprobó el examen está dada por P(A B) P(A) P(B) P(A B) 0.675
40 40 40
b. Utilizando la regla de la suma, tenemos que la probabilidad de que el estudiante sea mujer o
15 31 13
reprobó el examen está dada por P(A' B ') P(A') P(B ') P(A' B') 0.825
40 40 40
c. Para calcular la probabilidad de que el estudiante sea mujer y reprobó el examen está dada por:
P(A ' B ') P(A ') P(B ') P(A ' B ') (Despejamos) P(A ' B ') P(A ') P(B ') P(A ' B ')
15 31 33
P(A ' B ') 0.325
40 40 40
Luego asociamos las probabilidades respectivas para cada uno de los eventos que se describen en el
enunciado de la siguiente forma:
137 50 124
P (M ) 0.685 P (H) 0.25 P (A) 0.62
200 200 200
33 29 92
P (H M ) 0.165 P(A H ) 0.145 P (A M ) 0.46
200 200 200
18
P(M H A) 0.09
200
Haciendo uso del complemento tenemos que P(M H A) 1 P((M H A')) ; por otra parte,
sabemos que son 175 estudiantes los que toman al menos alguna de las clases de modo que, serán 25
los que no toman ninguna de ellas, lo cual nos lleva a N (M H A)' 25
25 7
Finalmente, la probabilidad buscada estará dada por P(M H A) 1 0.875
200 8
Una urna contiene 15 bolas numeradas del 1-15, de las cuales, 5 son rojas, cuatro
blancas y 6 son azules, todas idénticas en forma y tamaño. Se seleccionan dos bolas de la urna.
Calcule la probabilidad de que exactamente una de ellas sea azul, si se extraen:
a) Para seleccionar dos bolas una tras otra sin reemplazo de un total de 15, tenemos 15 para la
primera opción y 14 para la segunda, de modo que, para seleccionar dos bolas de 15 sin reemplazo,
hay 15 14 210 formas de extraerlas. Para los eventos favorables, es decir, que exactamente una
de ellas sea azul, tenemos los siguientes casos: 1. La promera bola es azul y la segunda no, lo cual
ocurre de 6 9 54 formas. 2. La primera bola no es azul y la segunda sí, lo cual ocurre de 9 6 54
formas. Entonces, tenemos en total 108 maneras de obtener una bola azul y por lo tanto,
108
P(sólo una bola es azul) 0.5142
210
b) Como las bolas se van a seleccionar al mismo tiempo, hablamos de la extracción de 2 bolas de la
15 que hay en la urna, es decir, consideramos las formas diferentes de extraer dos elementos de 15 a
15!
través de combinaciones; así, C2
15
105 formas distintas de extraer dos bolas de manera
2!(15 2)!
simutánea. Los eventos favorables para los que exactamente una de ellas sea azul serán
C16 C19 6 9 54 formas.
54
Por o tanto, P(sólo una bola es azul) 0.2571
210
1. Se tienen 15 computadoras de las cuales, 9 2. En una urna se colocan tres pelotas con los
son del modelo 345 y 6 del modelo 387. Si se números 1, 2 y 3 respectivamente. Si se extraen
venden 5 equipos: dos pelotas al azar, sin reemplazo, determina
a) ¿Cuál es la probabilidad de que de las 5 a) La probabilidad de que la suma de los
computadoras vendidas, 3 sean del modelo 345? números sea 5.
b) ¿Cuál es la probabilidad de que de las 5
computadoras vendidas al menos 4 sean del b) La probabilidad de obtener una suma menor
modelo 387? o igual a cuatro.
c) ¿Cuál es la probabilidad de que las 5
computadoras vendidas sean del mismo modelo?
7. De una caja que contiene 8 galletas de fresa, 8. En un estacionamiento hay 8 autos ford, 9
5 de vainilla y 3 de chocolate se extrae una a la jetta y 11 toyota. Si se selecciona al azar un auto
azar. Determina la probabilidad de que sea: para revisión cual es la probabilidad de que
a) de fresa a) sea toyota o ford.
b) No de vainilla b) No sea ford
c) de fresa o de chocolate
9. De los 200 estudiantes que tiene el maestro 10. Se lanza una moneda y un dado de manera
Ismael en sexto semestre, 100 estudian simultánea. Sea el evento A: la moneda cae
probabilidad y estadística, 90 estudian química águila y B: el dado cae en número par.
y 60 estudian probabilidad y estadística y Determina P(A B) .
química. Si se selecciona un estudiante al azar,
cual es la probabilidad de que:
a) sea un estudiante de PE o química.
b) que no estudie PE y química.
13. Si se tira un dado tres veces, determina la 14. Un examen de contabilidad consta de 2
probabilidad de que: preguntas de falso y verdadero, 3 preguntas de
a) se obtenga el número cinco en los dos opción múltiple con 4 opciones de respuesta.
primeros tiros. ¿Cuál es la probabilidad de que un estudiante
b) se obtenga un 5 en exactamente dos de los responda correctamente a todas las preguntas
tres lanzamientos. del examen, si lo contesta al azar?
15. En el cecyt18, 4 profesores pueden ser 16. En una canasta hay 5 platanos, 4 naranjas y
seleccionados para asistir a proyecto aula; el dos mangos. ¿Cuál es la probabilidad de que al
director no sabe cuántos serán requeridos; puede escoger 2 frutas al azar por lo menos una sea
ser 1, 2, 3 o los 4. ¿Cuál es la probabilidad de mango?
que sean seleccionados sólo dos profesores?
17. En una bolsa hay 6 pelotas blancas y 8 rojas. 18. Se organiza un comité de seis personas en el
Se extraen simultánemente 3 pelotas. Calcula la que debe haber dos arquitectos de siete que hay
probabilidad de obtener: en la compañía y 4 ingenieros de los 9 que hay
a) Las tres blancas en la compañía.
b) Las tres rojas a) ¿Cuál es la probabilidad de que en el comité
c) No sean las tres blancas haya un ingeniero en particular?
d) Al menos una sea blanca b) ¿Cuál es la probabilidad de que en el comité
queden Noé y salvador que son ingenieros y
Lucia que es arquitécto?
19. Sebastian está jugando con 5 soldaditos 20. Vania y sus nueve amigas, se quieren formar
iguales, tres caballitos iguales y dos carritos en fila.
rojos. Los está ordenando en fila, a) ¿Cuál es la probabilidad de que Vania quede
a) ¿Cuál es la probabilidad de que en los 3 al frente de la fila?
primeros lugares de la fila queden los caballitos? b) ¿Cuál es la probabilidad de que los primeros
b) ¿Cuál es la probabilidad de que los dos cuatro lugares siempre estén ocupados por
carritos queden al final de la fila? Vania, Victor, Hatziry y Natasha?
P(A B) P(el evento A ocurre en un primero ensayo y el evento B ocurre en un segundo ensayo)
A) Verdadero B) Falso
A) x 0 B) x 3 C) x 4 D) x 1 E) x 2
Observe que, en este caso, la solución a los dos reactivos son A) para el primer problema y A) para
el segundo problema. Si calculamos las posibilidades a nuestro espacio muestral, tenemos que
S {AA, AB, AC, AD, AE, BA, BB, BC, BD, BE}
A B
A B C D E A B C D E
Luego, en este caso tenemos 10 posibilidades y cada una de ellas tiene la misma probabilidad de
1
ocurrencia; por lo tanto P(A A) 0.100 (elegir la respuesta A de la primer pregunta y la
10
respuesta A de la segunda pregunta)
1
Ahora, con base en el diagrama de árbol, P(A) (Pregunta 1) y
tenemos que,
2
1 1 1 1 1 1 1
P(A) (Pregunta 2); por lo tanto, . Con lo que P(A B) P(A) P(B)
5 2 5 10 2 5 10
143 157
P(A) 0.48 P(B) 0.52
300 299
En este caso argumentaremos que tenemos 143 Después de haber seleccionado a un sujeto con
sujetos que resultaron positivos y el número un resultado de prueba positivo, quedan 299
total de sujetos es de 300. sujetos en total, de los cuales, 157 tienen
resultados negativos de la prueba.
Debemos ajustar la probabilidad del segundo suceso para reflejar el resultado del primer suceso
(la selección del segundo sujeto se realiza sin reemplazar al primero y, entonces, la segunda
probabilidad debe considerar que en la primera selección eliminó a un sujeto).
Consideremos, entonces, por ejemplo, jugar a la baraja en zacatecas y después, jugar a la baraja
en Aguascalientes son sucesos independientes porque el resultado de jugar en Zacatecas no
afecta el resultado de jugar en Aguascalientes.
El suceso de tomar el camión de pasajeros para ir a la escuela a tiempo son sucesos
dependientes, porque el resultado de que tome o no el camión de pasajeros afectará la
probabilidad de llegar o no a la escuela a tiempo.
Sí P(AyB)=P(A)*P(B)
P(AyB)
¿A y B son
"Regla de la independientes? P(AyB)=P(A)*P(A|
multiplicación" B)
No "Calcule la
probabilidad de B
suponiendo que A ya
ocurrió"
a. Suponga que las dos selecciones aleatorias se realicen con reemplazo, es decir, una vez seleccionada
la primera calculadora se regresa a la muestra antes de tomar la siguiente.
b. Suponga que las dos elecciones aleatorias se realizan sin reemplazo, es decir, al sacar la primera
calculadora, no se regresa al lote antes de elegir la segunda calculadora.
Consideremos tres calculadoras que funcionan bien y dos que están defectuosas, es decir, BBB DD.
B B B D D B B B D D
B B B D D B B D D
a. Si elegimos las calculadoras con reemplazo, las dos selecciones son independientes, ya que el
segundo evento no se ve afectado por el primero y así, en cada selección hay tres calculadoras en
buen estado y dos defectuosas; por lo tanto, como todas las calculadoras tienen la misma probabilidad
3 3
de ser elegidas, tenemos que P(A B ) 0.36
5 5
b. Si elegimos las calculadoras sin reemplazo, las dos selecciones son dependientes, ya que el segundo
evento se ve afectado por el primero y, así, en la primera selección hay tres calculadoras en buen
estado y dos defectuosas, total cinco; después de elegir una calculadora que funciona bien en la
primera selección, quedan cuatro calculadoras, dos que funcionan bien y dos que no; por lo tanto,
3 2
P(A B ) 0.30
5 4
La probabilidad condicional se usa cuando en el cálculo de un suceso se sabe que ha ocurrido otro
suceso con el cual se relaciona, es decir, los sucesos son dependientes.
Si consideramos dos sucesos A y B dependientes, tales que P(A) 0 , entonces, para expresar la
probabilidad de B dado que A ha ocurrido lo expresamos como P(B | A) 0 ; análogamente, si
P(B) 0 , entonces, para expresar la probabilidad de A dado que B ha ocurrido lo expresamos como
P(A | B) 0 .
2
a) si la primera lata elegida al azar fue dietética ya que sólo quedan dos latas dietéticas.
9
3
b) si la primera lata elegida al azar no fue dietética ya que quedan las tres latas dietéticas.
9
2 3
Así, la elección adecuada de la probabilidad o es probabilidad condicional ya que su valor se
9 9
encuentra condicionado de que el primer refresco seleccionado haya sido normal o dietético.
De un total de 20 músicos hay 7 que tocan la guitarra eléctrica, 11 que tocan piano y
3 que tocan ambos instrumentos. Si seleccionamos al azar a uno de estos músicos, ¿Cuál es la
probabilidad de que, al elegir a un músico al azar, éste toque la guitarra dado que el músico toca el
piano, es decir, P(G | P) ?
Así, utilizando la regla de la probabilidad condicional tenemos que para calcular la probabilidad de
que, al elegir a un músico al azar, éste toque la guitarra dado que el músico toca el piano, está dada
3
por P (G | P ) P (G P ) 20 3
0.2727
P (P ) 11 11
20
Observe que en este caso nuestro espacio muestral está dado por S {1,2,3, 4,5,6} .
a. Sabemos que se ha obtenido un número par, es decir, hay tres posibles resultados: 2, 4 o 6, de
1
los cuales, en sólo uno de ellos ocurre el 4. Por lo tanto P (4 | par ) .
3
b. Sabemos que se obtuvo un número menor que 6, por lo que hay 5 posibles resultados: 1, 2, 3,
3
4 y 5, de los cuales en tres de ellos obtenemos un número impar, es decir, P (impar | 6) .
5
P(A B c ) P(B Ac )
c. P (A | B ) d. P (B | A )
c c
P (B c ) P (Ac )
Para calcular la probabilidad condicional nos Para calcular la probabilidad condicional nos
apoyaremos de un diagrama de Venn. apoyaremos de un diagrama de Venn.
Observe que (A B c ) está dada por: Observe que (B Ac ) está dada por:
Luego, (A B c ) A B A (A B ) y, Luego, (B Ac ) B A B (A B ) y,
por tanto: por tanto:
Por otra parte, P(B c ) 1 P(B ) 1 0.5 0.5 Por otra parte,
P (A ) 1 P (A) 1 0.2 0.8
c
Por lo tanto:
Por lo tanto:
P(A B c ) 0.1
P(A | B c ) 0.2 P(B Ac ) 0.4
P(Bc ) 0.5 P(B | Ac ) 0.5
P(Ac ) 0.8
a. Si se elige al azar a una de las 300 personas de la prueba, calcule la probabilidad de que la persona
resulte positiva, dado que en realidad consumió drogas.
b. Si se elige al azar a una de las 300 personas de la prueba, calcule la probabilidad de que la persona
realmente haya consumido drogas, dado que tuvo un resultado de prueba positivo.
119
P (persona positiva | consumio drogas ) 0.975 .
122
“El consumidor de droga tiene una probabilidad de 0.975 de obtener un resultado de prueba positivo”
119
P(consumio drogas | prueba positiva ) 0.832
143
“En algunos casos de prueba positiva, existe una probabilidad de 0.832 de que la persona realmente
haya consumido drogas”
Suponga que un lote de computadoras está compuesto por 256 equipos de las marcas
Soni, Del y HPe las cuales se ubicaron en los tres centros de cómputo del cecyt18. Si una persona
elige al azar una computadora Del, ¿Cuál es la probabilidad de que dicha computadora esté asignada
al centro de cómputo 2?
Soni 30 45 23
Del 15 34 23
HPe 29 45 12
Para calcular la probabilidad de elegir una computadora Del y ésta esté asignada al centro de
cómputo 2 está dada por:
P(CC 2 | Del )
P(A B)
a. Sabemos que P(B | A) , entonces, despejando tenemos que, P(A B) P(A) P(B | A)
P(A)
.
10
Así, tenemos en la urna en total 15 canicas, de las cuales, 10 son blancas, por lo tanto, P (A) .
15
Cuando calculamos la probabilidad del evento B, restringimos la extracción a una bola blanca, por
lo que en la urna quedan sólo 14 canicas, de las cuales, nueve son blancas. Entonces la probabilidad
9
para extraer una segunda canica blanca está dada por P (B | A) .
14
Finalmente, calculamos la probabilidad de las dos canicas extraídas sean blancas, está dada por
10 9 90
P(A B ) P(A) P(B | A) 0.4285
15 14 210
b. Al sacar dos canicas, una tras otra, sin repetición, puede ocurrir exactamente una roja de dos
formas:
Cuando la primera canica es roja y la segunda no lo es.
Cuando la primera canica no es roja y la segunda sí lo es.
Sean los eventos: A1: “La primera canica extraída es roja” y, B1: “La segunda canica
5 10 50
extraída no es roja”, entonces, P(A1 B1) P(A1) P(B1 | A1) 0.2380
15 14 210
Sean los eventos: A2: “La primera canica extraída no es roja” y, B2: “La segunda canica
10 5 50
extraída es roja”, entonces, P(A2 B 2) P(A2) P(B 2 | A2) 0.2380
15 14 210
1. En una encuesta acerca de qué periódico lee 2. En el Cecyt-18 el 50% de los estudiantes
la gente se obtuvieron los siguientes datos: el tienen el cabello negro, el 35% de los
30% de la gente lee La Jornada, el 20% lee El estudiantes tiene los ojos cafés y 15% tiene los
Universal y el 4% lee ambos. a. Si se selecciona ojos cafés y cabello negro. Si se elige un alumno
un lector que lee El Universal, ¿Cuál es la al azar y este:
probabilidad de que lea La Jornada? a. tiene cabello negro, ¿Cuál es la probabilidad
de que tenga los ojos cafés?
3. Los siguientes datos sobre 100 senadores del 108 congreso de Estados Unidos
Hombre 46 39 1
Mujer 5 9 0
b) Si seleccionamos al azar a un senador, ¿Cuál es la probabilidad de elegir a una mujer, dado que
seleccionamos a un individuo independiente?
4. En un salón de clases, el 60% son hombres y 5. En una escuela de 1000 estudiantes, 200
el 40% son mujeres. El 25% de los hombres son juegan algun deporte, 100 están en una banda,
menores de 15 años al igual que el 50% de las 50 juegan algú deporte y están en la banda y
mujeres. ¿Cuál es la probabilidad de que al 750 no participan de ninguna actividad. ¿Cuál
elegir un estudiante al azar este sea hombre es la probabilidad de que al elegir a un
dado que es menor de 15 años? estudiante de forma aleatoria, este juegue
algún deporte dado que, ya pertenece a la
banda?
El teorema de Bayes es una forma más general de calcular la probabilidad condicional, en la cual,
deseamos calcular la probabilidad de que ocurra un evento Bi , dado que un evento A ha ocurrido.
evento A (A B ) .
i 1
i
P(B | A)
P(A)
, P(A) 0 P(A)
i 1
P(B ) P(A | B )
P(Bi A)
i 1
i i
Teorema de Bayes
P(Br ) P(A | Br )
P(Br | A) k
P(B ) P(A | B )
i 1
i i
Una empresa recibe monitores para computadora de tres proveedores diferentes, 55%
del proveedor B1 , 35% del proveedor B2 y 10% del proveedor B3 ; además, el 90% de los monitores
del proveedor B1 , 80% de los monitores del proveedor B2 y 78% de los monitores del proveedor B3
funcionan correctamente.
Ahora, supongamos que estamos interesados en saber la probabilidad de que algún monitor que se
recibe en la empresa funcione correctamente.
Como A denota el correcto funcionamiento de un monitor recibido por alguno de los tres proveedores
y así mismo, B1 , B2 , B3 son los eventos de que el monitor que funciona correctamente proviene de
alguno de los tres proveedores, tenemos entonces que A (A B1 ) (A B2 ) (A B3 ) donde
B1 , B2 , B3 son eventos mutuamente excluyentes, así como (A B1 ),(A B2 ),(A B3 ) también son
mutuamente excluyentes.
Por lo tanto P(A) P(A B1 ) P(A B2 ) P(A B3 ) y como hemos dicho anteriormente:
Entonces,
Con esta expresión, tenemos que la probabilidad de elegir al azar un monitor y éste funcione
correctamente está dada por:
Observe pues, que, la probabilidad de que el monitor funcione correctamente está dada por la suma
de los productos de las probabilidades correspondientes a cada rama del árbol.
Luego, la probabilidad de que la persona elegida fume es igual a la probabilidad de que fume y sea
hombre más la probabilidad de que fume y sea mujer. Entonces, denotamos los siguientes sucesos:
Así, la probabilidad de seleccionar a un trabajador al azar y éste fume está dada por la probabilidad
de que el sujeto seleccionado se hombre y además fume, más la probabilidad de que, el sujeto
seleccionado sea mujer y además fume, es decir, P(F ) P(H F ) P(H c F ') .
0.6 (F)
0.75 (H)
0.4 (F')
0.3 (F)
0.25 (H')
0.7 (F')
Luego, la probabilidad de seleccionar a un trabajador y éste sea fumador está dada por
P(F ) P(H F ) P(H c F ')
P(H )P(F | H ) P(H c )P(F | H c ) (0.75)(0.6) (0.25)(0.3) 0.525
El teorema de Bayes se define como una probabilidad condicional basada en el resultado de un hecho
ya ocurrido para describir otra propiedad específica, es decir, que se tiene nueva información con la
cual se determina si una probabilidad se debe a una causa específica.
La expresión que nos permite aplicar la regla de Bayes en su forma simple está dada por
P (A) P (B | A)
P (A | B ) que ilustramos con los ejemplos siguientes.
P (B )
Aplicando la regla de Bayes, tenemos que se trata de una probabilidad condicional, ya que, nos
piden la probabilidad de seleccionar un neumático de forma aleatoria y este haya sido
producido por la máquina A dado que este fue defectuoso, es decir, P (A | B ) P(A) P(B | A) .
P (B )
P(A) P(D | A)
0.03 (D) P(A | D)
P(D)
0.7 (A)
(0.70)(0.03)
0.97 (D') 0.3888
(0.70)(0.03) (0.3)(0.11)
0.11 (D)
0.3 (B) Recuerde que en el denominador es la
0.89 (D') probabilidad de que el neumático esté
defectuoso lo cual, nos lleva a dos ramas en las
cuales se tiene el neumático defectuoso que
provienen de la máquina A y de la máquina B.
Observemos que U 1 ,U 2 ,U 3 representan una partición de nuestro espacio muestral y como la urna se
1 1 1
elige al azar, entonces, P(U1 ) , P (U 2 ) y P (U 3 ) .
3 3 3
Nos piden calcular P (U i | N ) para saber cuál de las urnas ha originado más probablemente la
P(Br ) P(A | Br )
P(Br | A) para cada una de las urnas como se muestra a continuación:
k
P(B ) P(A | B )
i 1
i i
1 2
P(U 1 ) P(N | U 1 ) 37
P(U 1 | N ) 0.23
P(U 1 ) P(N | U 1 ) P(U 2 ) P(N | U 2 ) P(U 3 ) P(N | U 3 ) 1 2 1 2 1 3
37 3 4 37
12
P(U 2 ) P(N | U 2 ) 34
P(U 2 | N ) 0.42
P(U 1 ) P(N | U 1 ) P(U 2 ) P(N | U 2 ) P(U 3 ) P(N | U 3 ) 1 2 1 2 1 3
3 7 3 4 3 7
13
P(U 3 ) P(N | U 3 ) 37
P(U 3 | N ) 0.35
P(U 1 ) P(N | U 1 ) P(U 2 ) P(N | U 2 ) P(U 3 ) P(N | U 3 ) 1 2 1 2 1 3
37 34 37
Por lo tanto, la segunda urna es la que con mayor probabilidad dio origen a extraer una bola negra.
Otra manera sencilla de aplicar el teorema de Bayes es haciendo uso de los diagramas de árbol. Para
ello, revisemos el siguiente ejemplo:
b) Si se elige un tornillo al azar y este salió defectuoso, ¿Cuál es la probabilidad de que haya sido
producido por la máquina M 1 ?
c) Si el tornillo no es defectuoso, ¿Cuál es la probabilidad de que haya sido producido por la máquina
M2?
Para responder a estas preguntas, vamos a construir un diagrama de árbol asignando las
probabilidades correspondientes para posteriormente aplicar el teorema de Bayes haciendo uso de los
siguientes eventos:
b) Si se eligió un tornillo defectuoso, para calcular la probabilidad de que haya venido de la máquina
M1 , considere el uso del teorema de Bayes, es decir,
P(M1 )P(D | M1 ) (0.6)(0.02)
P(M1 | D) 0.5
P(M1 )P(D | M1 ) P(M 2 )P(D | M 2 ) (0.6)(0.02) (0.4)(0.03)
De acuerdo con el enunciado, la prueba detecta la presencia de plomo dado que lo hay con una
probabilidad de P (P | A) 0.9 y detecta la ausencia de plomo en el agua dado que no lo hay con
una probabilidad dada por P (P | B ) 0.8 . Entonces:
a) Para saber la probabilidad de que haya plomo en el agua dado que la prueba dio positiva estará
P(A) P(P | A) (0.2)(0.9)
dado por P(A | P ) 0.53
P(A) P(P | A) P(B) P(P | B ) (0.2)(0.9) (0.8)(0.2)
b) Para saber la probabilidad de que realmente haya plomo dado que la prueba ha dado negativa
P(A) P(P | A) (0.2)(0.1)
estará dada por P(A | P ) 0.030
P(A) P(P | A) P(B) P(P | B) (0.2)(0.1) (0.8)(0.8)
c) Para calcular la probabilidad de que haya plomo en la muestra y además la prueba salga positiva
estará dada por P (A P ) P (A) P (P | A) (0.2)(0.9) 0.18
Señale que para calcular el valor de P(P ) , observemos en el diagrama de árbol que será la suma de
los productos de los casos en que se da un resultado de prueba positivo por cada uno de los casos en
que la muestra contiene o no plomo, es decir, P (P ) (0.9)(0.2) (0.2)(0.8) 0.34
La enfermera del doctor Juárez es una persona en la que no se puede confiar, pues
cuando el doctor no está, la probabilidad de que no le inyecte un suero a un paciente es de 0.6. Se
sabe que si a un enfermo se le inyecta el suero tiene la misma probabilidad de mejorar que de
empeorar, pero si no se le inyecta, la probabilidad de que mejore es de 0.20. Al regreso del doctor
Juárez, encuentra que un enfermo ha empeorado. ¿Cuál es la probabilidad de que la enfermera haya
olvidado poner el suero al paciente?
Menciona que si se le inyecta el suero a un paciente tiene la misma probabilidad de mejorar que de
empeorar, es decir, P(C | A) P(D | A) y que, si no se le pone el suero, la probabilidad de mejorar
está dada por P(D | B) 0.20
Observe, además que, los sucesos C y D forman un sistema completo, así como sus intersecciones con
A y B forman también un sistema completo para los espacios probabilísticos condicionados por A y
B, luego, P(C | A) P(D | A) 1 ; además, sabemos que P(C | A) P(D | A) de donde
P(C | A) P(D | A) 0.5 ; por otra parte, P(C | B) P(D | B) 1 de donde 1 P(C | B) 0.20
encontrando que P(C | B) 1 0.20 0.8
Para encontrar la probabilidad de que la enfermera haya olvidado poner el suero al paciente dado
P (B ) P (C | B ) (0.6)(0.8)
que empeoró tenemos que P(B | C ) 0.7058
P (A) P (C | A) P(B ) P (C | B ) (0.4)(0.5) (0.6)(0.8)
Por lo tanto, el 70.58% de las veces un paciente empeora por culpa de la enfermera.
1. Tres maquinas: A, B y C producen el 40%, 25% y el 35% de los telefonos de la empresa Telquel
respectivamente. Se ha detectado que 6%, 2% y 4% respectivamente de los teléfonos producidos por
las máquinas están defectuosos.
b) Si se eligió al azar un teléfono defectuoso, ¿Cuál es la probabilidad de que haya sido ensamblado
por la máquina A?
c) Si se eligió al azar un telefono y no está dectuoso, ¿Cuál es la probabilidad de que haya sido
ensamblado por la máquina B?
2. En un hospital de especialidades médicas, la Dra. Aylin atiende al 50% de los pacientes, el Dr.
Badillo atiende al 30% de los pacientes y el Dr. Campos atiende al 20% de los pacientes. Se sabe
tambien que, la Dra. Aylin le pide examenes sanguíneos al 10% de sus pacientes, el Dr. Badillo le
pide examenes sanguíneos al 15% de sus pacientes y el Dr. Campos le pide examenes sanguíneos al
20% de sus pacientes.
b) ¿Cuál es la probabilidad de que la Dra. Aylin haya tratado a un paciente si a este se le pidieron
examenes sanguíneos?
c) ¿Cuál es la probabilidad de que el Dr. Badillo haya tratado a un paciente si a este no se le pidieron
examenes sanguíneos?
a) P(A)
b) P(B | A)
c) P(B | A')
5. Una empresa de colocaciones ha realizado un estudio sobre los trabajos solicitados por personas
de entre 18-35 años, de entre 36-55 años y más de 56 años. El informe que desarrolla la empresa
clasifica a estas personas como aptas o no aptas para el trabajo solicitado, y de los datos que se
tienen se observa que sólo el 20% son aptos para el trabajo solicitado, de los cuales, un 17% tienen
más de 56 años, un 33% tienen entre 36-55 años y un 50% tienen entre 18-35 años. Respecto a los
no aptos que solicitan un empleo, un 45% tienen más de 56 años, un 45% tienen entre 36-55 años y
un 10% tienen entre 18-35 años.
a) ¿Qué porcentaje de estas personas se encuentran entre 18-35 años y están calificados para el
trabajo solicitado?
b) ¿Cuál es la probabilidad de que una de estas personas que solicitan trabajo tengan entre 36-55
años?
c) De las personas de más de 56 años que solicitaron un trabajo, ¿Qué porcentaje no son aptos para
los puestos?
a) Si se elige al azar una de las urnas y se extrae una carta que resulta estar marcada con el número
3, ¿Cuál es la probabilidad de que haya salido de la urna 2?
b) ¿Cuál es la probabilidad de que si se elige al azar una urna y se extrae una carta esté marcada
con el número 1?
8. En un acuario se tienen 2 especies de peces. El 35% de los peces son de la especie azul y el 65%
son de la especie roja. De la especie azul, el 40% son machos mientras que, de la especie roja el 60%
son hembras. Si se selecciona un pez al azar,
9. Una empresa de bicicletas fabrica tres tipos de bicicletas: principiantes, intermedios y expertos
con una proporción de 40%, 50% y 10% respectivamente. La probabilidad de que una bicicleta
principiante se averíe durante el pimer año es de 0.08, la de que se averíe una bicicleta intermedia es
de 0.05 y la de tipo expertos con 0.10.
a) ¿Cuál es la probabilidad de que una bicicleta producida por esa empresa sufra una avería antes
del primer año de uso?
10. En el Municipio de Morelos, se tienen los siguiente grupos de acuerdo con su respectiva edad:
Niños, Adultos y Ancianos. Se conoce también la proporcion que representa cada uno de estos
grupos en la población y se conoce también la incidencia de la tos en cada uno de los grupos como
se muestra a continuación:
Variable aleatoria Es aquella (casi siempre se representa por x ) que toma un valor
numérico único para cada uno de los resultados del espacio muestral de
un experimento de probabilidad.
Distribución de Muestra los posibles resultados de un experimento y la probabilidad de
probabilidad que cada uno se presente.
Variable aleatoria Adopta sólo cierto número de valores separados, es decir, hay huecos
discreta entre uno y otro y algunas veces acepta valores fraccionarios o decimales.
Por ejemplo, un contador de personas que suben a un transporte público.
Variable aleatoria Tiene un número infinito de valores y, esos valores pueden asociarse con
continua mediciones de una escala continua, de manera que, no existan huecos o
interrupciones. Por ejemplo, un velocímetro
Suponga que nos interesa saber el número de águilas que podemos obtener al lanzar una moneda 3
veces. ¿Cuál sería la distribución de probabilidad del número de águilas?
Si lanzamos una moneda 3 veces, entonces, los resultados posibles serán 8, como se ilustra en la
siguiente tabla:
Analizando la tabla anterior, tenemos que el resultado “cero águilas” ocurre sólo una vez; el resultado
una águila ocurre 3 veces, el resultado dos águilas ocurre tres veces y el resultado tres águilas ocurre
sólo una vez. Luego, con base en estos resultados podemos construir una distribución de probabilidad
de los eventos relativos a cero, una, dos y tres águilas en tres lanzamientos de una moneda.
Considere que, si lanzamos dos dados, el espacio muestra S estará compuesto por 36 formas diferentes
en las cuales, pueden caer los dados. Si registramos las posibles sumas al lanzar los dos dados,
tendremos que:
+ 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
P(x) 1 donde x asume todos los valores posibles. La suma de todas las
Observe que, el primer requisito surge del hecho de que la variable aleatoria x representa todos los
eventos posibles en el espacio muestral completo, de modo que, tenemos la certeza (con probabilidad
1) de que uno de los eventos va a ocurrir.
1 0.5
P(x) 0.2 0.5 0.4 0.2 1.30 lo que
2 0.4 prueba que P(x ) 1 y por lo tanto no es
x
¿ P (x ) , x 0,1, 2, 3, 4 determina una distribución de probabilidad?
10
x x Recuerde que para ser una distribucion de
P (x )
10 probabilidad, P(x ) debe satisfacer los dos
0 0 requisitos anteriores, es decir,
P (0)
10
1 1 0 1 2 3 4 10
P (1)
10 1. P(x ) 10 10 10 10 10 10 1
lo que prueba que P(x ) 1 .
2 2
P (2)
10
3 3 2. Observe que cada una de las probabilidades
P (3)
10 toma valores entre cero y uno.
4 4 x
P (4) Por lo tanto, P (x ) es una distribución de
10 10
probabilidad.
Suponga que se lanza una moneda dos veces donde X nos respresenta la variable
aletoria del número de sellos que se pueden obtener.
Para dar solución al inciso a) consideremos el espacio muestral S {SS, SA, AS, AA}
0 x 0
1 0x 1
4
F (x ) 1 1 3
1x 2
4 2 4
1 1 1 1 x2
4 2 4
Observe que el salto que hay de cero sellos a un sello es de 0.25, el salto que hay de un sello
a dos sellos es de 0.5 y el salto que hay de dos sellos en adelante será de 0.25, es decir, el
gráfico muestra, además, la probabilidad para cada uno de los valores que toma la variable
aleatoria.
1. P(X k ) F (k )
2. P (X k ) F (k 1) 1. P (X k ) P (X k ) F (k )
3. P (X k ) 1 F (k 1) 2. P (X k ) P (X k ) 1 F (k )
4. P(X k ) 1 F (k ) 3. P (m X k ) F (k ) F (m )
5. P (m X k ) F (k ) F (m 1)
c) P(X 2.4) 1 F (2.4) 1 0.9 0.1 ya que, 2.4 X y, por tanto, P(X k ) 1 F (k )
e) P(0.3 X 1.5) F (1.5) F (0.3) 0.5 0.3 0.2 ya que, 0.3 y 0.5 X y, por tanto,
P(m X k ) F (k ) F (m )
Otra opción para el cálculo de las probabilidades es ubicar cada uno de los valores buscados
en las desigualdades correspondientes en la función de distribución acumulada.
X f (x ) F (x )
0 0.3 0.3
1 0.2 0.5
2 0.4 0.9
3 0.1 1
Así, una distribucion de probabilidad queda resumida por su media y su desviación estándar. La
media de una distribución de frecuencias se idenifica mediante la letra griega “miu” ( E(x) ), y la
desviación estándar, con la letra sigma ( ).
Media E(x)
La media representa un valor típico para representar la localización central de una distribución de
probabilidad. La media de una distribución de probabilidad también recibe el nombre de “valor
esperado”. Es el valor que se esperaría observar en promedio si el experimento se repite una y otra
vez. Se trata de un promedio ponderado en el que los posibles valores de una variable aleatoria se
ponderan con sus correspondientes probabilidades de ocurrencia. Por tanto, la media de una
distribución de probabilidad discreta se calcula con la expresion:
E (x ) x P(x )
Recuerde que, para la media en una tabla de frecuencias, f representa la frecuencia de clase y N
representa el tamaño de la población. Luego, si reescribimos la fórmula de la media de una tabla de
frecuencias, tenemos que:
(f x) f x x f [x P(x )]
N N N
f
Analice que en la fracción , el valor de f es la frecuencia con la que ocurre x y N es el tamaño
N
f
de la población; así que representa la probabilidad del valor x , es decir, P(x ) .
N
[(x ) P(x )]
2
2 V (x )
La desviación estándar es la raíz cuadrada positiva de la varianza que nos describe la dispersión de
la variable aleatoria respecto a la media o valor esperado, es decir,
2
[(x ) P (x )]
Según la regla práctica, para la desviación estándar, la mayoría de los valores deben caer dentro de
dos desviaciones estándar respecto a la media; no es muy común que un valor difiera de la media en
más de 2 desviaciones estándar. Esta regla no es absoluta puesto que hay expertos que utilizan 3
desviaciones estándar. De esta forma, podemos identificar valores poco comunes si se determina que
caen fuera de los siguientes límites:
La tienda de electrónica “Ísis” vende un modelo especial de teléfono celular. Hay sólo
cuatro equipos en existencia y el gerente quiere saber cuál será la demanda de hoy para este modelo
de teléfono celular. El gerente sabe que la distribución de probabilidad para x , la demanda diaria
para el teléfono celular es como se muestra en la siguiente tabla.
x 0 1 2 3 4 5
P(x ) .15 .30 .25 .15 .10 .05
x P(x ) x P(x) (x )2 (x )2 P (x )
0 0.15 0 3.61 0.5415
1 0.30 0.30 0.81 0.243
2 0.25 0.5 0.01 0.0025
3 0.15 0.45 1.21 0.1815
4 0.10 0.40 4.41 0.441
5 0.05 0.25 9.61 0.4805
Totales 1.00 1.90 2 1.89
1.89 1.37
a) La media o valor esperado en este caso vale 1.90 , lo cual, nos indica que, se
espera que alrededor de 1.90 clientes quieran comprar un teléfono celular el día de hoy,
considerando que un cliente compra sólo un teléfono..
b) Según la regla práctica para la desviación estándar la mayoría de los valores deben de
caer en un intervalo de no más de dos desviaciones estándar, es decir,
2 1.90 (2)(1.37) y por tanto (0.84, 4.64) que será en nuestro contexto (0, 4.64) .
Entonces, como x 5 está fuera del intervalo, diremos que es improbable que cinco o más
clientes deseen comprar un teléfono celular el día de hoy. De hecho, si observamos la tabla
P(x 5) es exactamente de 0.05, o sea, una vez en 20.
5. Dada la función de distribución acumulada 6. Sea X una variable aleatoria discreta con
0 x 2 función de distribución de probabilidad
0.4, si x 1
0.1 -2 x 0
F (x ) 0.3 0 x 2 , calcule 0.2, si x 0
P (X x ) , encuentre la
0.6 2x 3 0.3, si x 2
1 x 3 0.1, si x 3
a) P(X 1.6) función de distribución acumulada y grafíquela.
b) P(1.4 X 2.6)
a
7. Dado que f (x ) , x 0,1, 2, 3, 4 es una distribución de probabilidad para una variable
2x
aleatoria, encuentre el valor de a.
x 0 1 2 3 4 5
P(x ) 0.28 0.37 0.17 0.12 0.05 0.01
a) ¿Cuál es la probabilidad de que una persona que toma café, seleccionada al azar, no se dé
descanso durante el día para tomar café?
b) ¿Cuál es la probabilidad de que una persona que toma café, seleccionada al azar, se dé más de
tres descansos durante el día para tomar café?
c) Encuentre la probabilidad de que x caiga en el intervalo ( 2 , 2 )
Una variable aleatoria continua tiene una probabilidad 0 de adoptar exactamente cualquiera de sus
valores a diferencia de una variable aleatoria discreta. Luego, su distribución de probabilidad no se
puede presentar en forma tabular. Para profundizar un poco más estas ideas consideremos lo
siguiente:
Sea una variable aleatoria cuyos valores son estaturas de todas las personas de un grupo numeroso
y que, son mayores de 25 años de edad.
Entre cualesquiera dos valores, digamos, por ejemplo, 1.78 y 1.83 metros hay un número infinito de
estaturas (por ejemplo 1.80m). Entonces, la probabilidad de elegir a una persona al azar que tenga
exactamente 1.80m de altura en lugar de una del conjunto infinito digamos (1.78, 1.83) y con
estaturas muy cercanas a la que buscamos es nulo. Por esta razón, asignamos una probabilidad 0 a
tal evento.
En cambio, si nos referimos a la probabilidad de seleccionar a una persona que mida al menos 1.78m
pero no más de 1.83m, nos estamos refiriendo a un intervalo en vez de un valor puntual de nuestra
variable aleatoria.
En este caso, nos interesa el cálculo de probabilidades para intervalos de variables aleatorias
continuas como, por ejemplo, P (a X b) , P(W c) , etc. Observamos pues, que, cuando X es
continua, P (a X b) P (a X b) P(X b) P (a X b) , es decir, no importa si incluimos
o no los extremos del intervalo, lo cual no sucede cuando hablamos de variables aleatorias discretas.
Una distribución de probabilidad de una variable aleatoria continua se pude representar por una
fórmula (mas no de forma tabular) como función de los valores numéricos de la variable aleatoria
continua X representada por f (x) . Así, cuando se trata con funciones continuas, a f (x) se le denomina
“Función de densidad de probabilidad” o simplemente “función de densidad de X”.
La mayoría de las funciones de densidad que tienen aplicaciones prácticas son continuas y sus gráficas
pueden tomar distintas formas; además, como se utilizarán áreas bajo curvas para representar las
probabilidades y éstas son números positivos, la función de densidad debe caer encima del eje “x”.
Entonces, la probabilidad de que X tome un valor entre a y b es igual al área sombreada bajo la
función de densidad entre x a y x b a partir del cálculo de la integral dada por:
P(a X b)
f (x)dx
a
2.
f (x)dx 1
Para profundizar un poco sobre esta definición revisemos los siguientes ejemplos:
b) Calcule P(0 X 1)
c) Calcule P(X 1)
Mostremos la solución.
a) Para comprobar que se trata de una función de densidad de probabilidad debemos probar que se
cumplen las dos condiciones de la definición antes mencionada, es decir:
f (x) 0 , para toda x . En este caso x siempre será positiva para cualquier valor en el
2
1.
3
intervalo 1 x 2 ya que, se trata de una función cuadrática.
2.
f (x)dx 1 . Para probar este punto calculamos la integral con límites infinitos, es decir,
antes de -1 y después de 2 la función vale cero y por tanto el área bajo la curva también vale
2 2
x2 x3 (2)3 (1)3 8 1 8 1
cero; luego,
f (x )dx
1
3
dx
9 1
1 . Se cumple.
9 9 9 9 9 9
1 1
x2 x3 (1)3 (0)3 1 0 1 0 1
b) P(0 X 1)
0
3
dx
9 0
9
9
0.1111
9 9 9 9 9
2 2
x2 x3 (2)3 (1)3 8 1 8 1 7
c) P(X 1)
1
3
dx
9 1
0.7777
9 9 9 9 9 9 9
considere que la
variable aleatoria X toma valores mayores o iguales a 1, de modo que, se considera como límite
inferior el valor 1 y el límite superior se toma de acuerdo con la función de densidad de probabilidad.
f (x )dx 1
2.
2 2
5x 3 x 4 5(2)3 (2)4 5(0)3 (0)4 40 28a
a(5x x )dx a a a 4
2 3
0 3 4
0 3 4 3 4 3 3
28a 3
Como
f (x )dx 1 , entonces,
3
1 28a 3 a
28
.
F (x ) P(X x )
f (t)dt para x .
Tenemos que para (1 x 2) , la función de distribución acumulada está dada por
x x x
t2 t3 x3 1 9x 3 9 x 3 1
F (x )
f (t )dt
1
3
dt
9 1
9
9 81
9
, por lo tanto, la función de
Función de densidad de
Gráfico de la función de densidad probabilidad
x 2
, 1 x 2
f (x ) 3
0, en otro caso
Función de distribución
Gráfica de la función de distribución acumulada acumulada
0, x -1
3
x 1
F (x ) , -1 x 2
9
1, x 2
(1)3 3 (0)3 3 1
Así, para calcular P (0 X 1) F (1) F (0) . Advierta que el resultado
9 9 9
obtenido a través de la función de distribución acumulada se puede obtener de manera directa
1
x2 1
calculando P (0 X 1)
0
9
dx .
9
3 3
1 x 3 1
a) Para mostrar que el área bajo la curva es igual a 1, calculamos
f (x)dx
1
2
dx 1
21 2 2
2.5 2.5
1 x 2.5 2 1
b) Para calcular P(2 X 2.5) , tenemos que, P(2 X 2.5)
2
2
dx
22
2
2 4
0, x 1
x 1
acumulada, está dada por F (x ) , 1 x 2.
2
1, x 2
1.6 1
d) Para calcular P(X 1.6) , tenemos que, P (X 1.6) F (1.6) 0.3
2
Función de densidad de
probabilidad
Función de distribución
acumulada
1 y /4
e , y0
f (x ) 4
0, en otro caso
b) Se considera que una lavadora es una ganga si no hay probabilidades de que requiera una
reparación general antes del sexto año, ¿Qué podemos decir al respecto? Calcule P(Y 6)
c) ¿Cuál es la probabilidad de que la lavadora requiera una reparación general durante el primer
año?
0, y0
F (y ) P(Y y ) x /4
e 1, 0 y
P(Y 6) e dy e y /4 lim e y /4 lim e b /4 lim e 6/4
4 6 b 6 b b
, entonces, la probabilidad
6
0 lim e 6/4 0.2231
b
es muy alta, lo cual significa que, hay un 22.31% de que la lavadora requiera reparación general
después de los 6 años; luego, no resulta ser una ganga.
c) Para calcular la probabilidad de que la lavadora requiera una reparación general durante el primer
año, está dada por la
1
1 y /4
1
P(0 Y 1)
0
4
e dy e y /4 e 1/4 e 0/4 0.7788 1 0.2211
0
Media E(x)
Para aclarar un poco el uso de la media, valor esperado o esperanza matemática, analicemos el
siguiente ejemplo, que muestra el interés de un ingeniero por la vida media de cierto tipo de
dispositivo electrónico, es decir, el tiempo que transcurre antes de que se presente una falla. Luego,
el valor esperado de la vida del dispositivo es un parámetro importante para su evaluación.
Sea X la variable aleatoria que denota la vida en horas de cierto dispositivo electrónico
20000
3 , x 100
cuya función de densidad de probabilidad es f (x ) x , calcule el tiempo de
0, en otro caso
vida en horas esperado para esta clase de dispositivo.
Para calcular el valor esperado o media para la función de densidad dada, tenemos que,
20000
E [X ]
x f (x )dx
x
100
x3
dx
b
20000 20000 20000 20000
100
x 2
dx lim
b
lim
x 100 b
b
200
(100)
c) Si se sabe que se han vendido más de 200kg en un día particular, encuentre la probabilidad de que
se hayan vendido más de 400kg.
a) Para calcular la probabilidad de que en un día cualquiera se vendan entre 400 y 800 kilogramos,
tenemos que:
500
500 800 800
1 1 1 1 x2
P(400 X 800)
400
500 2xdx
500
500 2
(1000 x )dx
2 5002
x2
5002
1000x
2
500
400
1 8 48 3 9 21 30
0.6
2 25 25 2 50 50 50
500
1000
x3 1 x3 500 2000 1000
500x 0 500kg
2
3 5002 0
5002 3
500 3 3 3
c) Si se sabe que se han vendido más de 200kg en un día particular, para encontrar la probabilidad
de que se hayan vendido más de 400kg, tenemos lo siguiente:
400
1
P X 400 X 200 P(X 400) 1 P(X 400)
1
500 2
xdx
P(X 400 | X 200) 0
400
1 8
1 x2 8
2 500 2
0
1 0 1
25 25 0.68 0.7391
200
2 2 0.92
1 1 0 1
1 x2 25 25
2 500 2
0
La desviación estándar (típica) para una variable aleatoria continua X con función
de densidad f (x) se define como la raíz cuadrada de la varianza, es decir,
V (x )
x f (x )dx 2
2 2
2 2 2
x 1 2 1 2 1 3
0
E [X ] x f (x )dx x 1 dx
2
0
x x dx x x
2 2 6 0
1 1 1 1 8 2
(2)2 (2)3 (0)2 (0)3 2 (0) 0.6666
2 6 2 6 6 3
2 x 2
2
2 x3 2
2
V (x ) x f (x )dx x 1 dx x dx
2 2 2 2 2
2 3 2 3
0 0
2 2 2
1 1 2 1 1 1 1 2 2 4 2
x 3 x 4 (2)3 (2)4 (0)3 (0)4 0
3 8 0 3 3 8 3 8 3 3 9 9
2
Finalmente, la desviación estándar será V (x ) 2 0.4714
9
b) La media E[x ]
c) La desviación estándar V [X ]
(6x 6x )dx
2
1
(6x 6x )dx
2
112 13 99
0.8
3x 2 2x 3 3(0.8)2 2(0.8)3 3(0.2)2 2(0.2)3
99
0.2
125 125 125 0.8839
0.2 2
3 2
1 3x 2 2x 3 1 3(0.2) 2(0.2) 3(0) 2(0) 1 13 0
3
112 112
125
0
125
1 1 1
3x 4 3 1
E [X ] x f x dx x (6x (1 x ))dx (6x 6x )dx 2x 3
2
2
2
3
2 2
0 0 0
V (x )
x f (x )dx 2 ,
2 2
con lo que,
1 1 2 1 1 2
V (x ) x f (x )dx x (6x 6x )dx (6x 6x )dx
2 2 2 2 2 3 4
2 2
0 0
1 2 2
3x 4 6x 5 1 3(1)4 6(1)5 3(0)4 6(0)5 1 3 6 1 1
0.05
2 5
0 2
2 5 2 5 2 2 5 4 20
1
Luego, el valor de la varianza está dado por V (x )
x 2 f (x )dx 2 0.05 Finalmente,
2
20
Solución:
a) Tenemos que la probabilidad de que la variable aleatoria sea menor que 0.5, implica calcular
0.5 0.5
x2 (0.5)2 (0)2 1
P(X 0.5)
0
xdx
2
0
2
2
0.125
8
b) La probabilidad de que la variable aleatoria tome valores entre 0.5 y 1.5 está dada por
1 1.5 1 1.5
x2 x2
P (0.5 x 1.5)
xdx
0.5 1
(2 x )dx
2 0.5
2x
2
1
3 9 1 3
3 2 0.75
8 8 2 4
0 1 0 1
1
2
1 2
2 2
V (x ) x f (x )dx x 2 (x )dx x 2 (2 x )dx 1
2 2 2
x dx (2x 2 x 3 )dx 1
3
0 1 0 1
1 11 7 1
2
1 1 0.1666
4 12 6 6
1
Finalmente, la desviación estándar está dada por V [X ] 0.4082
6
1. Dada la siguiente función de densidad, 2. Dada una variable aleatoria continua X y una
determina lo siguiente: función f (x ) , definida en todos los reales,
determine el valor de k con el que f (x ) es una
x3 función de densidad de X.
x , si 0 x 2
f (x ) 4 kx , x [0, 2)
0, en otro caso 2k ,
f (x )
x [2, 3)
Determine k y
8k 2kx , x [3, 4)
a) ¿Se trata de una fdp? 0, en otro caso
b) Calcula la P(X 1.7) calcule:
c) Calcula la P(0.5 X 1)
d) Calcula la P(X 1.5) a) La función de distribución acumulada
e) Calcula la P(X 1.5 | X 1.2) b) Calcule la P(2.5 X 3)
c) Calcula la P(X 3 | X 2)
3. Determina si las siguientes funciones de 4. Determine el valor de k para que f (x ) sea una
densidad, nos sirven para calcular función de densidad de probabilidad.
probabilidades.
x , x (0,1)
a) f (x ) 5 x , x [1, 2]
0, en otro caso
1
x , x (1,1)
b) f (x ) 2
0, en otro caso
5. Sea X una variable aleatoria con función de 6. Sea X una variable aleatoria continua con
densidad e ,
x
x 0
función de densidad f (x )
0, x 0
kx , x (0, 2)
f (x ) k (4 x ), x [2, 4] a) Determine si se trata de una función de
0, en otro caso
densidad de probabilidad.
b) Determine el valor esperado para la variable
a) Obtenga el valor de k con el cual f (x ) es una aleatoria.
función de densidad de probabilidad. c) Calcule P(X 1.5)
b) Calcule le valor esperado de la variable d) Calcule P(0.5 X 10)
c) Calcule la función de distribución acumulada
d) Calcule la desviación estándar para la
variable aleatoria.
9. La función de densidad de probabilidad de 10. El tiempo que pasa, en horas, antes de que
una variable aleatoria continua X, es descrita un componente que forma parte de un
por: reproductor DVD empiece a fallar tiene la
x siguiente función de densidad:
si 0 x 1
2 1 x
e 2000 si x 0
1 si 1 x 2
f (x ) 2000
f (x ) 2 0,
en otro caso
x 3
si 2 x 3 a) Calcule la probabilidad de que el componente
2 funcione más de 1000 horas antes de fallar.
0, en otro caso
b) Determine la probabilidad de que el
Determina F(x) . componente falle antes de 2000 horas.
11. Una gasolinera tiene dos bombas y cada una tiene una capacidad de despachar hasta 10,000
litros de gasolina por mes. La cantidad total de gasolina despachada en un mes es una variable
aleatoria X (expresada en decenas de miles de litros), con una fdp dada por:
x si 0 x 1
f (x ) 2 x si 1 x 2
0, en otro caso
a) Calcular la probabilidad de que la gasolinera despache entre 8000 y 13000 litros de gasolina en
un mes.
b) Si se sabe que la gasolinera ha despachado más de 12000 litros de gasolina en un mes en
particular, encuentre la probabilidad de que haya despachado más de 18000 litros durante el mes.