Probabilidad

Contenido
1. ESTADÍSTICA DESCRIPTIVA ................................................................................................. 4

Introducción a la estadística ........................................................................................................ 4
Estadística descriptiva e inferencial.............................................................................................. 6
Población y muestra .................................................................................................................... 9
Tipos de variables ...................................................................................................................... 10
Muestreo .................................................................................................................................... 11
Muestreo aleatorio simple ....................................................................................................... 12
Muestreo sistemático con iniciación aleatoria ......................................................................... 12
Muestreo estratificado ............................................................................................................ 13
Muestreo por conglomerados .................................................................................................. 14
Fuentes de información .............................................................................................................. 15
Representación gráfica de datos ................................................................................................. 16
Histograma ............................................................................................................................. 16
Polígono de frecuencias........................................................................................................... 21
Diagrama de tallo y hojas ....................................................................................................... 24
Ojiva menor que y mayor que ................................................................................................ 27
Diagrama circular ................................................................................................................... 29
Tabla de distribución de frecuencias .......................................................................................... 30
Medidas de tendencia central para datos no agrupados .............................................................. 38
Medidas de tendencia central para datos agrupados................................................................... 42
Sesgo .......................................................................................................................................... 48
Medidas de posición ................................................................................................................... 53
Cuartiles (Qk ) para datos no agrupados ................................................................................ 53
Cuartiles (Qk ) para datos agrupados..................................................................................... 56
Deciles ( Dk ) para datos no agrupados y agrupados ............................................................... 58
Percentiles ( Pk ) para datos no agrupados y agrupados ........................................................... 61
Diagramas de caja y bigotes....................................................................................................... 64
IPN 1 CECYT-18
Medidas de dispersión ................................................................................................................ 70
Rango y amplitud................................................................................................................... 71
Varianza y desviación estándar para datos no agrupados ....................................................... 74
Varianza y desviación estándar para datos agrupados ............................................................ 77
Medidas de forma ...................................................................................................................... 80
Sesgo ...................................................................................................................................... 80
Curtosis .................................................................................................................................. 83
Teorema de Chebyshev........................................................................................................... 87
La regla empírica (Regla 68-95-99.7) ...................................................................................... 90
2. PROBABILIDAD...................................................................................................................... 94
Teoría de conjuntos ................................................................................................................... 94
Operaciones con conjuntos...................................................................................................... 97
Técnicas de conteo ................................................................................................................... 117
Combinaciones ..................................................................................................................... 124
Permutaciones ...................................................................................................................... 126
Permutaciones circulares ...................................................................................................... 132
Teoría de las probabilidades..................................................................................................... 136
Probabilidad Clásica............................................................................................................. 138
Probabilidad Frecuencial ...................................................................................................... 140
Eventos compuestos ............................................................................................................. 142
Regla del producto ............................................................................................................... 154
Probabilidad condicional ...................................................................................................... 158
El teorema de Bayes ............................................................................................................. 166
3. DISTRIBUCIONES DE PROBABILIDAD ............................................................................. 178
Distribuciones de probabilidad discreta .................................................................................... 178
Requisitos para una distribución de probabilidad discreta .................................................... 181
Funcion de distribución acumulada ...................................................................................... 182
Media, varianza y desviación estándar para distribuciones de probabilidad, discretas .......... 185
Media   E(x ) ................................................................................................................... 185
Varianza  2  V (x ) y desviación estándar  ..................................................................... 187
Distribuciones de probabilidad continua .................................................................................. 191
IPN 2 CECYT-18
Requisitos para una distribución de probabilidad ................................................................. 192
Función de distribución acumulada ...................................................................................... 194
Media, varianza y desviación estándar para distribuciones de probabilidad, continuas ......... 197
Media   E(x ) ................................................................................................................... 198
Varianza y desviación estándar para distribuciones de probabilidad, continuas .................... 200
IPN 3 CECYT-18
1. ESTADÍSTICA DESCRIPTIVA
Introducción a la estadística
¿Por qué estudiar estadística?
La estadística es un área importante en la toma de decisiones del día a día y que está fuertemente
ligada a la vida diaria de los seres humanos; si analizamos programas de estudio de universidades, la
gran mayoría de ellos incluyen a la estadística desde un punto de vista particular, pero, en todas, el
interés será el valor típico y la variación que experimentan los datos; por ejemplo:
a) En ingeniería se enfoca en la cantidad y la calidad de unidades que fabrica una determinada

máquina.
b) En Administración, el interés son cuestiones como utilidades, horas de trabajo y los salarios.
c) En Psicología les importan los resultados de las pruebas psicológicas.
Entonces, ¿Por qué estudiar estadística?
1) La estadística es una ciencia transversal pues apoya a distintos campos como el campo científico
social e industrial y colabora con otras ciencias para formar saberes nuevos; por ejemplo, al unir
la estadística con la biología, nace la bioestadística, al unirla con la psicología, nace la psicometría
y con la economía nace la econometría. Cuando se realiza un censo, se trata de un estudio en el
que visitan casa por casa para hace una encuesta que recolectará varios datos: cuántos viven en
el hogar, cuántos trabajan, estudian, sexo, edad, etc.
Esto permitirá saber cuántos habitantes habrá, cuántos son mujeres, hombres, cuántas familias
están en pobreza extrema y de ahí se pueden tomar decisiones como la implementación de
programas sociales que ayuden a corregir o mejorar las condiciones de vida de las familias y a
mejorar la situación del país.
2) Actualmente todos los países llevan un registro de todos sus casos positios de COVID-19, que se
presentan en el país, clasificándolos en leves, moderados, graves, recuperados y fallecidos;
posteriormente, a través de cálculos estadísticos, se puede predecir cómo se comportará el virus
en una determinada población de acuerdo a los datos recolectados. Toda esta información ayuda
a visualizar la magnitud del problema y desarrollar estrategias para evitar los contagios.
3) En una escuela, los docentes estamos acostumbrados a tomar las notas que los estudiantes
obtienen y se analizan el número de aprobados y reprobados y poder relacionar variables como,
por ejemplo, bajo rendimiento académico con la desnutrición, bajo nivel educativo de los padres
con la deserción escolar; estas variables podrían estar relacionadas y la estadística nos permitiría
saber si se relacionan o no.
IPN 4 CECYT-18
4) Durante las elecciones presidenciales a los candidatos se basan en estudios estadísticos para saber
las probabilidades que tienen de ganar las elecciones según la simpatía de los encuestados por
un candidato en particular. Este estudio podría dar una idea de quién podría ser el próximo
presidente de un determinado país.
5) Si quieres abrir un negocio, debes evaluar las probabilidades de que tenga éxito de acuerdo a
muchas variables, por ejemplo,
a. Es una zona residencial
b. Cuántos habitantes hay
c. Cuantos negocios iguales hay en la zona
d. Cuál es el ingreso promedio de las personas en esa zona
e. Etc.
6) Un estudio nos señala que en promedio 15 millones de personas en el mundo están utilizando
Facebook en este momento; luego, saber esta información le permite a una empresa vender sus
productos asegurando la mayor audiencia posible.
Así, los métodos estadísticos se utilizan para tomar decisiones que afectan en la vida diaria y que
pueden afectar en nuestro bienestar, por ejemplo:
a. Las compañías de seguros utilizan el análisis estadístico para establecer tarifas de seguros
de casas, autos, seguro médico, seguro de vida, ¿Por qué? A una mujer de 20 años le
quedan 60.25 años de vida, a un hombre de 87 años le quedan 4.56 años de vida; así, las
primas de seguros de vida se establecen con base en los cálculos de expectativas de vida.
b. Las agencias de protección ambiental toman muestras del agua periódicamente para
analizar la calidad de la misma.
c. Las investigaciones médicas estudian los niveles de curación de enfermedades, por ejemplo,
si un grupo de personas toma una aspirina de manera diaria y un grupo no lo hace, ¿se
reduce el riesgo de un ataque al corazón?
7) Conocer sobre los métodos que utiliza la estadística, facilita la comprensión sobre cómo tomar
decisiones y ofrecer un mejor entendimiento de cómo nos afectan. Por ello con el fin de tomar
una decisión informada y con base en estudios estadísticos, será necesario llevar a cabo lo
siguiente:
a. Determinar si existe información adecuada o si se requiere información adicional de manera
que no se obtengan resultados erróneos.
b. Resumir los datos de manera útil e informativa.
c. Analizar la información disponible.
d. Obtener conclusiones y hacer inferencias al mismo tiempo que se evalúa el riesgo de tomar
una decisión incorrecta.
IPN 5 CECYT-18
8)
ESTADÍSTICA. Es la rama de las matemáticas que se encarga de la obtención,
organización, análisis, interpretación y presentación de un conjunto de datos con el fin de
explicar y predecir algún fenómeno y tomar decisiones de forma eficaz.
La estadística se divide en dos grandes ramas:
Medidas de tendencia
Media, mediana, moda.
central
Estadística
Varianza, desviación
Descriptiva Medidas de dispersión.
estándar y rango.
Se analiza cómo se juntan

Medidas de distribución o de
Inferencial los valores en torno a la
forma.
media (Campana de Gauss)
Estadística descriptiva e inferencial

El estudio de la estadística se divide en dos categorías: la estadística descriptiva y la Estadística
inferencial.
ESTADÍSTICA DESCRIPTIVA. Es una rama de la estadística que

comprende la recolección, organización, resumen y presentación de datos siendo su
principal objetivo, describir las características de los datos a partir de indicadores, tablas
y gráficos.
La estadística descriptiva incluye la construcción de gráficas, tablas, cuadros y el cálculo de varias

medidas descriptivas como promedios, medidas de variación, percentiles, etc.
Si el conjunto de mediciones es toda la población sólo se necesita obtener conclusiones basadas en la

estadística descriptiva; sin embargo, podría ser demasiado costoso o llevar mucho tiempo. Por esta
razón la rama de la estadística que se encarga de estos problemas será la estadística inferencial.
IPN 6 CECYT-18
Algunos ejemplos para la estadística descriptiva son los siguientes:
La siguiente gráfica nos muestra la población en México de 1910 al año 2015 y se trata de
una estadística descriptiva si calcula el crecimiento porcentual de una década a otra.
En México, hay aproximadamente 40,812km de carreteras federales, 9,174km de autopistas

federales, 85,076km de carreteras estatales.
Según un estudio estadístico, una persona gastó en promedio $500 pesos para el día del amor
y la amistad en el año 2020, lo cual representó $50 pesos más que en el año 2019. Los hombres
gastaron el doble que las mujeres.
Una gran cantidad de datos organizados como los censos de población, los salarios quincenales de
miles de trabajadores, las respuestas de 2000 votantes para elegir presidente de México, resultan de
poca utilidad si no tenemos un contexto de uso; sin embargo, la estadística descriptiva permite
organizar estos datos y darles significado.
1)
ESTADÍSTICA INFERENCIAL. Analiza los datos obtenidos en la estadística
descriptiva y de ahí surgen explicaciones sobre las características de la población estudiada.
El objetivo de la estadística inferencial es hacer inferencias (obtener conclusiones, hacer predicciones,

tomar decisiones) acerca de las características de una población a partir de información contenida en
una muestra.
IPN 7 CECYT-18
Por ejemplo:
Si se estudia el comportamiento de un número reducido de personas, se podría inferir como

podría ser el comportamiento en la población en general. Si regalamos helados de fresa en el
cecyt-18 a 100 estudiantes y posteriormente hacemos una encuesta para saber si les gustó el
sabor y todos responden que sí les gustó, es muy probable que al resto de los estudiantes
también les guste el sabor.
¿Cómo hacer inferencias acerca de una población utilizando información contenida en una muestra?
La tarea se vuelve más sencilla si organizamos el problema en pasos lógicos:
1. Especifique las preguntas a contestar e identifique la población de interés. En la

encuesta de elecciones en México 2018, el objetivo es determinar quién obtendrá más votos;
así, la población de interés será el conjunto de todos los votantes en México. Cuando
seleccionamos la muestra, es importante que sea representativa de esta población.
2. Decida cómo seleccionar la muestra. Esto se denomina diseño del experimento o
procedimiento de muestreo, ¿la muestra es representativa de la población de interés? Por
ejemplo, si una muestra se selecciona del estado de zacatecas, ¿esta muestra es representativa
de todos los votantes de México? ¿la muestra es lo suficientemente grande para contestar a
todas las preguntas hechas en el paso 1? Un buen diseño de muestreo contestará las preguntas
planteadas, con un costo mínimo para el experimentador.
3. Seleccione la muestra y analice la información muestral. Sin importar cuanta
información tenga la muestra, se debe usar un método de análisis apropiado para extraerla.
4. Use la información del paso 3 para hacer una inferencia acerca de la población.
Hay muchos métodos para poder hacer inferencias. Podría haber diez métodos diferentes para
estimar la respuesta humana a un medicamento experimental, pero un procedimiento podría
ser más preciso que otros. Aquí es la tarea del investigador de usar el mejor para poder hacer
inferencias sobre la población de estudio.
5. Determine la confiabilidad de la inferencia. Como sólo usamos una parte de la población
para hacer inferencias podríamos estar en un error al momento de inferir. Si mandamos hacer
un estudio de mercado y se estima que mi empresa crecerá un 26% este año, ¿Cuánta
confianza podemos poner en esa estimación?, ¿es suficientemente confiable para establecer
metas de producción? Toda inferencia estadística debe incluir una medida de confiabilidad
que dice cuánta confianza tiene usted en dicha inferencia.
IPN 8 CECYT-18
Población y muestra
}
1)
POBLACIÓN. Consiste de la colección de todos los individuos u objetos de interés
bajo consideración en un estudio estadístico.
MUESTRA. Es una parte de la población de interés de la cual se obtiene información.
En estadística, las muestras son tomas parciales de la población que se quiere analizar; luego, del
análisis que se hace de la muestra se hacen inferencias sobre la población.
Con el objetivo de inferir algo de la población, lo común es que se tome una muestra, para ello
consideremos los siguientes ejemplos:
Si se quiere evaluar la calidad educativa de los bachilleratos en México, se aplican exámenes

en algunas escuelas de distintas regiones aplicando las técnicas del muestreo que consideren
a los bachilleratos representativos.
Los compradores de frijol, toman muestras sólo de algunos costales y con base en ello
determinan la calidad del frijol de toda la cosecha de un agricultor.
Si el conjunto de datos de interés está constituido por todos los estudiantes del cecyt18, cada
estudiante es un elemento estadístico, mientras que el conjunto de todos los estudiantes será
la población a estudiar; luego, una muestra podría ser el grupo 6IM2 de la carrera de
mantenimiento industrial.
IPN 9 CECYT-18
Tipos de variables
Una variable es una característica que cambia o varia con el tiempo o para diferentes personas u
objetos de estudio.
VARIABLE CUALITATIVA. Una variable es cualitativa cuando la

1) característica que se estudia es de naturaleza no numérica.
VARIABLE CUANTITATIVA. Una variable es cuantitativa cuando
aparece en forma numérica.
Variable continua. toman cualquier valor en un intervalo especifico,
por ejemplo, presión del aire en una llanta, el peso de un estudiante, etc.
Variable discreta. Adoptan sólo ciertos valores y existen vacíos entre
ellos
En estadística, las muestras son tomas parales de la población que se quiere analizar; luego, del
Lo anterior se resume en la siguiente tabla:
Variables
Cualitativas Cuantitativas
Estado civil
Color de cabello
Discreta Continua
Color de ojos
Sexo
- Peso de una persona

- Miembros en un hogar
- Presión de aire en
- Televisores en un hogar
una llanta.
- Automóviles en un
- Temperatura en un
estacionamiento
día soleado
IPN 10 CECYT-18
Muestreo
Seleccionar una muestra capaz de representar con exactitud las preferencias del total de la población
no es sencillo pues, debe ofrecer resultados que permitan obtener información y tomar decisiones. Un
buen muestreo resulta indispensable sobre todo cuando el estudio de toda la población resulta ser
muy caro (para un estudio sobre la vida media de un foco ahorrador, deben ser analizados muchos
focos hasta que se fundan o dejen de funcionar). Por lo tanto, definimos al muestro de la siguiente
forma:
MUETREO. Es un conjunto de métodos y procedimientos para obtener muestras

para desarrolla un estudio estadístico.
De acuerdo con la teoría del muestreo, la muestra debe lograr una representación adecuada de la
población, reproduciendo lo mejor posible, los rasgos esenciales o las características importantes para
ser investigadas. Entonces, debe reflejar las similitudes y diferencias encontradas en la población.
Así, buscamos con el mínimo de costo obtener la máxima información sobre la población que se
estudia; por tanto, se debe tener cuidado para asegurar la aleatoriedad de las muestras.
Existen distintos tipos de muestreo o criterios de clasificación; analizaremos los llamados métodos de
muestreo probabilístico, para los cuales, todos los elementos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras tienen
la misma probabilidad de ser elegidas. Sólo estos métodos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables.
IPN 11 CECYT-18
Muestreo aleatorio simple
Es una muestra seleccionada de tal manera que, todos los elementos de la población
tienen la misma probabilidad de ser elegidos. Se asigna un número a cada individuo de
la población; luego, a través de algún medio mecánico (bolas dentro de una bolsa, tablas
de números aleatorios, software para generar números aleatorios (Excel, etc.),
calculadora, computadora, etc.) se eligen tantos sujetos como sea necesario para
completar el tamaño de la muestra requerido.
Suponga que, de la población estudiantil del Cecyt18 se seleccionan de manera aleatoria 20

estudiantes para encuestarlos y obtener información sobre los estudiantes que cuentan con al menos
dos dosis de la vacuna contra COVID-19. La población es de 1000 estudiantes.
A cada estudiante le asignamos un número entre 1 y 1000.
Seleccionamos la muestra con los números y con ayuda de algún software para generar números
aleatorios.
De esta forma, hemos seleccionado a 20 estudiantes con la técnica de muestreo aleatorio simple.
Muestreo sistemático con iniciación aleatoria
En este método la primera unidad se selecciona de forma aleatoria y el resto siguiendo un

patrón establecido.
Suponga que, se está estudiando una población compuesta de N=360 estudiantes y se quiere una
muestra de n=30.
Conseguir un listado ordenado de los N alumnos de la población total.
Definir el intervalo del tamaño de selección o salto sistemático k  360

30
 12 alumnos.
IPN 12 CECYT-18
Se elige un número aleatorio entre 1 y k, es decir, 1 y 12 que se determina de forma aleatoria y será
nuestro punto de arranque.
Se inicia el proceso de elección sistemática con el primer dato, por ejemplo, el 3, segundo elemento
3+12=15, tercer elemento, 15+12=27, …
El proceso termina cuando se completan los 30 estudiantes que serán la muestra para nuestro estudio.
En una línea de producción se puede hacer un muestreo cada 200 unidades o cada determinado
tiempo seleccionar una muestra para el análisis.
Muestreo estratificado
Se tiene un muestreo estratificado cuando se tiene una población que puede ser dividida
en varias subpoblaciones a las que llamamos estratos, de acuerdo con ciertas
características que deben cumplir sus integrantes.
Suponga que, se está estudiando una población compuesta de N=360 estudiantes y se quiere una
Consiste en considerar categorías distintas entre sí (estratos-subpoblaciones) que poseen
gran homogeneidad respecto a alguna característica (profesión, municipio, sexo, estado
civil, etc.); lo que pretende este muestreo es que todos los estratos de interés estén
representados adecuadamente en la muestra.
Suponga que se debe seleccionar una muestra de tamaño 20% de toda la población del cecyt-18 que
tiene 1000 estudiantes.
La muestra debe cumplir la condición de que exista al menos un representante de cada una de las
carreras técnicas que tiene la institución educativa que son: laboratorista químico (250 estudiantes),
sistemas digitales (320 estudiantes) y mantenimiento industrial (430 estudiantes).
El tamaño de la muestra es del 20% con 200 estudiantes que se deben tomar de entre las carreras
laboratorista químico, sistemas digitales y mantenimiento industrial; luego, el tamaño de la muestra
por estrato (carreras) será la siguiente:
IPN 13 CECYT-18
320
𝑆𝑖𝑠𝑡𝑒𝑚𝑎𝑠 𝑑𝑖𝑔𝑖𝑡𝑎𝑙𝑒𝑠 =
1000
= 0.32 → 𝑛 = 0.32 × 200 = 64 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠
250
𝐿𝑎𝑏𝑜𝑟𝑎𝑡𝑜𝑟𝑖𝑠𝑡𝑎 𝑞𝑢í𝑚𝑖𝑐𝑜 =
1000
= 0.25 → 𝑛 = 0.25 × 200 = 50 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠
430
𝑀𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑎𝑙 =
1000
= 0.43 → 𝑛 = 0.43 × 200 = 86 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠
De esta forma el 20% de la muestra queda representado por todos los estratos 𝑛 + 𝑛 + 𝑛 .
Muestreo por conglomerados
Este tipo de muestreo es similar al muestreo estratificado debido a que la población

también se divide en estratos, pero, con la diferencia de que aquí, no se requiere un
representante de cada estrato porque elegimos una muestra de estratos y después
seleccionamos
Suponga unaestudiando
que, se está muestra deuna
cada estrato.compuesta de N=360 estudiantes y se quiere una
población
Suponga que se quiere realizar una encuesta de los usuarios del metro de la ciudad de México (con 4
millones de usuarios diarios aproximadamente).
Como la población es demasiado grande, la dividimos en estratos (estaciones del metro).

Posteriormente elegimos una muestra de estaciones para hacer el levantamiento de datos (estaciones).
En este caso para la selección de los usuarios se puede emplear el muestreo sistemático.
Esta forma de muestreo disminuye considerablemente el costo de la muestra ya que no requiere

enumerar las unidades poblacionales.
IPN 14 CECYT-18
Fuentes de información
Las técnicas de recolección y el diseño de experimentos facilitan la obtención de los datos en forma
rápida y económica, de ellas depende el éxito de una buena información; éstas deben ser lo más
apegadas a la población que se está estudiando. Las fuentes o formas más comunes de recolección de
datos son:
Entrevista por teléfono. Su ventaja es que es rápido, barato y sencillo y se pueden cubrir
grandes áreas sin desplazarse. Sólo se pueden hacer preguntas sencillas y las personas que
contestan no siempre quieren responder a las preguntas, pues les causa molestia.
De puerta en puerta. Contienen alto grado de respuesta, los cuestionarios deben ser cortos,
se cubren grandes áreas, etc.
Abordaje en la calle. Las áreas deben ser de gran movimiento, se utilizan generalmente
para cuestionar sobre la aceptación de determinados productos, debe ser breve ya que la gran
mayoría de los entrevistados tienen prisa o están sujetos a determinado horario.
Entrevista personal. Resulta costosa y emplea mucho tiempo, por lo general son muestras
pequeñas, se debe tener en cuenta la buena selección de los entrevistados pues de ellos
dependen las respuestas obtenidas.
Entrevista en centros comerciales. Es común cuando se desea saber el impacto de algún
producto, se suele desarrollar en áreas con mucho flujo de personas (centros comerciales,
plazas, etc.)
Entrevistas a través de las redes sociales. Hoy en día, las entrevistas a través de medios
como Facebook, twitter, etc., han cobrado mucha importancia por su facilidad y la gran
capacidad para abarcar grandes cantidades de datos y en poco tiempo.
Luego, la recolección de datos es muy importante y cómo se lleve a cabo es un factor determinante
para la obtención de datos verídicos y confiables.
IPN 15 CECYT-18
Representación gráfica de datos
Cuando trabajamos con conjuntos de datos, resulta útil organizarlos y resumirlos a través de tablas,
gráficas, histogramas, entre otros, que permitan su mejor comprensión y una mejor toma de
decisiones.
Distribución de frecuencias (tabla de frecuencias). Indica cómo un conjunto

de datos se divide en varias categorías (o clases) al listar todos los elementos en
cada clase o categoría generada.
Histograma
Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin
espacios entre sí). La escala horizontal representa las clases de valores de datos y en cuanto que la
escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de
frecuencia.
La frecuencia (frecuencia absoluta) de

cada clase es representada por una barra
(rectángulo) vertical cuya altura es igual
a la frecuencia absoluta de esa clase. Las
barras deben ser colocadas de manera
continua (una al lado de la otra).
Para elaborar un histograma analicemos

el siguiente procedimiento con base en el siguiente ejemplo:
Una tubería de aluminio por donde pasará oxígeno en un hospital, se fabrica bajo una estricta
especificación de un diámetro de 5  0 .0 2 5cm . De un lote de 1000 tubos se ha tomado una muestra
de 50 tubos cuyas medidas se listan a continuación:
5.018 5.016 5.022 5.018 5.030 5.002 5.011 4.992 5.001 4.998
4.982 5.018 4.991 5.017 5.000 5.031 5.018 4.976 5.023 4.999
4.994 5.001 4.998 5.016 5.017 5.009 5.019 4.989 5.026 4.990
4.978 5.000 4.989 4.990 4.998 5.010 5.002 5.020 5.016 4.980
5.013 5.001 5.026 4.992 4.992 5.003 4.994 4.984 5.021 5.015
IPN 16 CECYT-18
1. Encontrar el rango. Localizamos el dato menor y el dato mayor, es decir,
rango  x max  x min  5.031  4.976  0.055
2. Determinar el número de clases. Definimos el número de clases a generar, para el cual,
10
podemos tomar k  1  log(N ) clases recomendadas (redondeando), de modo que,
3
10
k 1 log(50)  6.6632  7 clases o categorías.
3
NOTA: En estadística no hay una cantidad establecida para las clases, sólo se recomienda
algo razonable, no pocas clases o no demasiadas. Algunas reglas utilizadas son las siguientes:
Determinar el entero más cercano a n , en donde n es el número total de observaciones.

Considerar el entero más cercano a log 2 (n ) , en donde n es el número total de observaciones.
La llamada regla de Stuges toma la cantidad de clases como el entero más cercano a
10
1 log(n) en donde n es el número total de observaciones.
3
Se considera una regla subjetiva para considerar intervalos entre 5 y 24, según sea el número
de datos.
3. Determinar el ancho de clase. Cada intervalo puede ser entonces de
rango 0.055
I    0.00785  0.008cm (procurar siempre subir la marca de clase
# de  clases 7
al valor más próximo hacia arriba, como en este caso)
4. Los límites de las clases. Podemos elegirlos de la siguiente manera:

a. La primera clase puede iniciar en 4.976 y terminar en 4.984
b. La segunda clase puede iniciar en 4.984 y terminar en 4.992
c. La tercera clase puede iniciar en 4.992 y terminar en 5.000
d. La cuarta clase puede iniciar en 5.000 y terminar en 5.008
e. La quinta clase puede iniciar en 5.008 y terminar en 5.016
f. La sexta clase inicia en 5.016 y terminar en 5.024
g. La séptima clase inicia en 5.024 y terminar en 5.032
NOTA: Hay ocasiones en que las clases ya están establecidas de modo que, no es necesario
desarrollar todo este procedimiento.
IPN 17 CECYT-18
5. Agrupamos los datos respecto a cada clase.
Número de CLASES FRECUENCIA DE NÚMERO DE

clase i DATOS DATOS
(FRECUENCIA
ABSOLUTA)
1 [4.976-4.984) //// 4
2 [4.984-4.992) ///// / 6
3 [4.992-5.000) ///// /// 8
4 [5.000-5.008) ///// //// 9
5 [5.008-5.016) //// 4
6 [5.016-5.024) ///// ///// ///// 15
7 [5.024-5.032) //// 4
TOTAL --- 50
Resultando la siguiente tabla:
NÚMERO DE CLASES O FRECUENCIA

CLASE INTERVALOS ABSOLUTA
1 [4.976-4.984) 4
2 [4.984-4.992) 6
3 [4.992-5.000) 8
4 [5.000-5.008) 9
5 [5.008-5.016) 4
6 [5.016-5.024) 15
7 [5.024-5.032) 4
TOTAL 50
IPN 18 CECYT-18
6. Se procede a generar el histograma, el cual incluye el eje vertical las frecuencias y en el eje
horizontal los límites reales de intervalos de clases de los datos, con lo cual se obtiene el
diagrama siguiente:
Una vez que tenemos el histograma con la información requerida, podemos realizar el análisis a
partir de la información inicial, en este caso, “bajo una estricta especificación de un diámetro de
5  0 .0 2 5cm ”.
De modo que, esto nos permite una tolerancia de acuerdo a los estándares de calidad para tubos
con medidas que están entre los valores [4.975  5.025] .
Observando el histograma podemos ver que los tubos de las primeras dos clases y la última clase,
no cumplirán con el estándar de calidad.
EJEMPLO: Considere las calificaciones del grupo 6IM1 en la unidad de aprendizaje de probabilidad
y estadística de 28 estudiantes. Construya una tabla con la distribución de frecuencias y genere una
gráfica de pastel.
7 10 10 7 3 9 9
2 7 8 7 9 8 7
10 8 10 6 9 10 8
10 8 8 7 10 10 10
IPN 19 CECYT-18
1. Determinamos el rango, es decir, rango  x max  x min  10  2  8
2. Determinamos los intervalos de clase haciendo uso de la regla de Stuges
10 10
k 1 log(N )  1  log(28)  5.8238  6
3 3
rango 8
3. Determinamos el ancho de las clases: I    1.3333
# de  clases 6
4. Construimos la tabla correspondiente
Número de CLASES FRECUENCIA DE NÚMERO DE DATOS

clase i DATOS (Frecuencia absoluta)
1 [2-3.33] // 2
2 [3.34-4.66] 0
3 [4.67-5.99] 0
4 [6-7.33] /////// 7
5 [7.34-8.66] ////// 6
6 [8.67-10] ///////////// 13
TOTAL --- 28
Resultando la siguiente tabla:
NÚMERO DE CLASES O FRECUENCIA

CLASE INTERVALOS ABSOLUTA
1 [2-3.33] 2
2 [3.34-4.66] 0
3 [4.67-5.99] 0
4 [6-7.33] 7
5 [7.34-8.66] 6
6 [8.67-10] 13
TOTAL 28
IPN 20 CECYT-18
Se procede a generar la gráfica de pastel o circular con ayuda de algún paquete como Excel
o bien, de forma manual.
Polígono de frecuencias
El polígono de frecuencias muestra la forma que tiene una distribución y es similar a un histograma.
Consiste de segmentos de recta que conectan los puntos medios de la clase (marca de clase) y las
frecuencias de la clase.
IPN 21 CECYT-18
Por ejemplo, la siguiente tabla muestra las clases, las frecuencias absolutas y las marcas de clase o
puntos medios de cada una de las clases para ser graficados y formar así el polígono de frecuencias.
Precios de venta Marca de clase o punto medio del Frecuencia

($) intervalo absoluta
Clases
[15 a 18) 18  15 8
 16.5
2
[18 a 21) 19.5 23
[21 a 24) 22.5 17
[24 a 27) 25.5 18
[27 a 30) 28.5 8
[30 a 33) 31.5 4
[33 a 36) 34.5 2
TOTAL 80
El polígono de frecuencias permite tener una vista rápida de las principales características de los
datos (máximos, mínimos, puntos de concentración, etc.).
IPN 22 CECYT-18
Ejemplo. Considere las medidas del pulso en latidos por minuto obtenidas de una muestra aleatoria
de 80 hombres con los resultados que se muestran a continuación.
Construye un polígono de frecuencias para la información dada.
HOMBRES
68 64 88 72 65 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 56 64 72
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 60 75
1. Construimos la tabla de distribución de frecuencias que incluya los intervalos, la marca de

clase y la frecuencia absoluta.
Clase Marca de clase Frecuencia absoluta
50 a 59 55.5 13
60 a 69 65.5 33
70 a 79 75.5 16
80 a 89 85.5 16
90 a 99 95.5 2
TOTAL 80
2. Observemos el polígono de frecuencias a continuación y responderemos a las siguientes

preguntas con base en el polígono de frecuencias y la tabla generada.
a. ¿Cuántos hombres participaron en el estudio? R. 80
b. ¿Cuál es el punto medio de la segunda clase? R. 65.5
c. ¿Qué se puede decir sobre los latidos en los hombres? R. Alrededor del 97.5% de los
hombres mantienen entre 60 y 90 latidos por minuto, mientras que, el 5% de los
hombres maneja arriba de 90 latidos por minuto.
IPN 23 CECYT-18
Diagrama de tallo y hojas
Un diagrama de tallo y hojas es una representación gráfica en la que se puede

observar la distribución de datos.
Las gráficas de tallo y hoja se pueden utilizar para representar colecciones de datos numéricos y nos
permiten representar la distribución de una variable cuantitativa.
Para construirlo basta separar en cada dato el último dígito de la derecha y le llamaremos “hoja” y
al dígito o los dígitos de la parte izquierda le llamaremos “tallo”.
NOTA: los datos deben estar ordenados de menor o mayor. Consideremos la siguiente tabla con 24
datos numéricos:
67 82 89 95 102 121
70 84 91 96 107 124
72 84 92 100 112 126
73 87 92 100 113 126
IPN 24 CECYT-18
1. El primer paso es ordenarlos de menor a mayor. Ya están ordenados en la lista anterior.
2. Separar el dígito menos significativo de cada número.
6|7 8|2 8|9 9|5 10|2 12|1
7|0 8|4 9|1 9|6 10|7 12|4
7|2 8|4 9|2 10|0 11|2 12|6
7|3 8|7 9|2 10|0 11|3 12|6
3. Se hace el siguiente arreglo con los números obtenidos partidos por una barra en la cual se
coloca en la parte izquierda los datos más significativos y en la parte derecha de la barra los datos
menos significativos como se muestra a continuación:
6 7
7 0 2 3
8 2 4 4 7 9
9 1 2 2 5 6
10 0 0 2 7
11 2 3
12 1 4 6 6
Tallo Hoja
Observe que cada uno de los datos menos significativos se agregan como hojas al lado derecho de
manera consecutiva como en el caso del 7 en tallo y 0 2 3 en hoja los cuales forman los números 70,
72 y 73.
Esta forma de representar información nos permite interpretar los datos de la siguiente manera:
¿Cuál es el dato que más se repite? En este caso son 84, 92, 100 y 126.
¿Cuál es el valor más alto observado? 126
IPN 25 CECYT-18
¿Cuántos datos hay en la muestra? 24
Ejemplo: el siguiente diagrama de tallo y hoja muestra las calificaciones obtenidas en un examen
de probabilidad y estadística. Responde lo siguiente con base en el diagrama.
2 2 3
3 0 0 0 9
4 0 1 1 6 9
5 0 3 5 7 8
6 0 1 1 5 6
7 0
Tallo Hoja
1. ¿Cuántos estudiantes presentaron la prueba? 22 estudiantes

2. ¿Qué calificación representa mayor frecuencia? La nota con mayor frecuencia es 30 o 3.0
3. ¿Cuántos estudiantes obtuvieron una calificación mayor o igual a 6? 6 estudiantes.
IPN 26 CECYT-18
Ojiva menor que y mayor que
Una ojiva es una gráfica que representa frecuencias acumuladas, y sirve para
determinar el número de frecuencias que se ubican por debajo o por encima de
algún valor específico.
La ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza fronteras de clase
a lo largo de la escala horizontal y frecuencias acumuladas a lo largo del eje vertical.
Para ilustrar el procedimiento para construir la ojiva mayor que y menor que, tomemos el
siguiente ejemplo:
Los siguientes datos corresponden al número de robos cometidos y la edad de los delincuentes
de una determinada ciudad.
Edad (Frecuencia (Frecuencia (Frecuencia

(Años) absoluta) acumulada) acumulada)
“Número Menor que Mayor que
de robos”
[5,10) 5 5 50  5  45
[10,15) 8 5  8  13 45  8  37
[15,20) 20 13  20  33 37  20  17
[20,25) 10 43 7
[25,30) 5 48 2
[30,35) 2 50 0
TOTAL N=50
IPN 27 CECYT-18
Las ojivas respectivas, quedan establecidas de la siguiente manera:
¿Qué cantidad de robos se

comete por delincuentes
menores de edad?
Localizamos en el gráfico un
aproximado de 18 años en el
eje “x” y trazamos una vertical
hasta interceptar a la gráfica
para después trazar una
perpendicular que nos permita
encontrar la intersección con el
eje “y” y poder encontrar la
cantidad de robos que se
cometen por menores de edad que en este caso podemos decir que son aproximadamente 30 robos
(60%, lo que significa que más del 50% de los robos se cometen por menores de edad).
Podemos decir que el 10% de los robos se cometen por niños menores de 10 años, es decir, 5
de cada 50 robos se cometen por niños menores de 10 años.
¿Qué cantidad de robos se

comete por delincuentes
mayores de edad?
Localizamos en el gráfico un
aproximado de 18 años en el
eje “x” y trazamos una
vertical hasta interceptar a la
gráfica para después trazar
una perpendicular que nos
permita encontrar la
intersección con el eje “y” y
poder encontrar la cantidad de
robos que se cometen por menores de edad que en este caso podemos decir que son aproximadamente
20 robos (lo que significa que más del 40% de los robos se cometen por mayores de edad).
Una minoría de robos se cometen por personas mayores de 30 años; en este caso, diremos
que 2 de cada 50 robos, lo que representa el 4%.
IPN 28 CECYT-18
Diagrama circular
Se utiliza para representar generalmente variables cualitativas en porcentajes.
La circunferencia tiene una medida de 360° que serán distribuidos entre el 100% de nuestros datos.
fi
Para distribuir los porcentajes en la circunferencia tomamos para cada clase xi 

N
 360 . El
valor en grados se puede redondear por comodidad.
Analicemos el siguiente ejemplo:
En un penal para mujeres, se entrevistó a 44 de ellas solicitándoles su estado civil al realizar el

levantamiento de datos. Las respuestas de las internas fueron las siguientes:
Estado civil (Frecuencia % en la gráfica Frecuencia

absoluta) circular relativa en
“Número de fi porcentaje
xi  (360)
internas” N
Casada 12 12 12
xi  
44
360  xi  
44

100% 
 98.2  27.3%
Soltera 20 163.7° 45.4%
Viuda 8 65.4° 18.2%
Divorciada 4 32.7° 9.1%
TOTAL N=44 360° 100%
IPN 29 CECYT-18
De modo que el diagrama circular correspondiente a los datos que aparecen en la tabla
anterior son los siguientes:
Tabla de distribución de frecuencias
Con el fin de organizar los datos para mostrar una distribución general de éstos y el lugar donde
tienden a concentrarse, además de, señalar los datos poco usuales o extremos, el primer procedimiento
para organizar los datos es una tabla de distribución de frecuencias.
TABLA DE FRECUENCIAS. Es una agrupación de datos en clases mutuamente

excluyentes que muestra el número de observaciones que hay en cada clase.
IPN 30 CECYT-18
Para ilustrar cada uno de los elementos analicemos la siguiente tabla de distribución de frecuencias
que ilustran los precios de venta de caminadoras para hacer ejercicio.
23197 20454 23169 19889 24220 22442 27453

18021 30872 28670 20895 21556 24296 35851
20047 24324 24533 21981 23372 23591 15446
19873 25277 23657 17968 28683 19587 27443
20004 20155 32277 20633 24285 24609 26613
20203 25783 35925 18890 25251 28034 20642
24052 15794 22817 23613 17357 19688 17399
20356 21722 29076 20445 23765 26661 19766
20962 26285 28337 17266 25799 18263 32492
21740 24571 20818 25449 21442 19331 20642
21639 26651 15935 22374 22845 27896 26237
30655 17891 19251
1. Encontrar el rango. Localizamos el dato menor y el dato mayor, es decir,

rango  x max  x min  35925  15446  20479
10
2. Determinar el número de clases. k  1  log(80)  7.3436  7 .
3
rango 20479
3. Determinar el ancho de cada clase. I    2925.571  3000 (se
# de  clases 7
redondea a una cifra conveniente asegurándonos que se cubra el rango).
4. Establecer los límites de los intervalos o clases. Se debe evitar la superposición de
límites de clase. Por ejemplo, clases como 1300-1400 y 1400-1500 no deberían emplearse ya
que podrían causar confusiones. De modo que para evitar este tipo de situaciones es
recomendable el uso de intervalos semiabiertos.
5. Clasifique y contabilice cada uno de los datos en las clases que se han establecido previamente
como se muestra a continuación:
IPN 31 CECYT-18
6. Cuente el número de elementos de la clase. El número de elementos que hay en cada
clase recibe el nombre de frecuencia absoluta de la clase f i .
NÚMERO DE Precios de venta FRECUENCIA

CLASE (Clases) ABSOLUTA
1 [15000-18000) 8
2 [18000-21000) 23
3 [21000-24000) 17
4 [24000-27000) 18
5 [27000-30000) 8
6 [30000-33000) 4
7 [33000-36000) 2
TOTAL
¿Qué podemos decir sobre esta tabla de frecuencias?
Los valores abarcan un rango de $15000 hasta aproximadamente $36000.

Los valores se concentran entre $18000 hasta $27000, con un total de 58 datos o el 72.5%
de los valores caen dentro de este rango.
La máxima concentración o frecuencia más alta se encuentra en la clase que va de $18000
a $21000. La mitad de la clase se ubica en $19500. De manera que $19500 representa un
valor típico.
NOTA. La organización de los datos en una distribución de frecuencias da como
resultado la pérdida de información detallada, es decir, al organizar los datos, no es posible
ubicar los valores 23197 y 26237; sin embargo, con los límites que hemos establecido
comunican el mismo significado y que como analistas llegaremos a la misma conclusión
sabiendo que un valor es de aproximadamente 15000 que si realmente cuesta 15546.
Intervalo o marca de clase. Se suma el límite superior más el inferior y se divide entre
Ext sup  Ext inf
dos, es decir, M i  . Es un punto representativo de cada clase también
2
llamado punto medio de la clase.
IPN 32 CECYT-18
NÚMERO DE Precios de venta FRECUENCIA Marca de clase
CLASE (Clases) ABSOLUTA Ext sup  Ext inf
2
1 [15000-18000) 8 16500
2 [18000-21000) 23 19500
7. Frecuencia relativa. Es la proporción o porcentaje de los datos que caen en cada categoría o
clase. Para convertir una frecuencia de distribuciones en una distribución relativa, se divide cada
una de las frecuencias por clase entre el número total de observaciones. Luego su cálculo será a
fi
través de hi  . La suma de frecuencias relativas acumuladas siempre es 1.
N
NÚMERO Precios de FRECUENCIA Marca de clase Frecuencia

DE CLASE venta ABSOLUTA Ext sup  Ext inf relativa
(Clases) 2
1 [15000-18000) 8 16500 8/80=0.1
2 [18000-21000) 23 19500 0.2875
3 [21000-24000) 17 … 0.2125
4 [24000-27000) 18 … 0.225
5 [27000-30000) 8 … 0.1
6 [30000-33000) 4 … 0.05
7 [33000-36000) 2 … 0.025
TOTAL 80 1.0000
8. Frecuencia absoluta acumulada. Para determinar la cantidad de elementos o valores que

son menores que un determinado valor o, un valor debajo del cual un cierto porcentaje de
valores se cumple. Estas cantidades se aproximan elaborando una distribución de frecuencias
acumuladas con representación gráfica de un polígono de frecuencias acumulativas. Para
ilustrarlo observe las siguientes gráficas:
IPN 33 CECYT-18
Precios de FRECUENCIA Marca de clase Frecuencia Frecuencia
venta ABSOLUTA Ext sup  Ext inf relativa acumulada
(Clases) 2
[15000-18000) 8 16500 8/80=0.1 8
[18000-21000) 23 19500 0.2875 8+23=31
[21000-24000) 17 22500 0.2125 31+17=48
[24000-27000) 18 25500 0.225 66
[27000-30000) 8 28500 0.1 74
[30000-33000) 4 31500 0.05 78
[33000-36000) 2 34500 0.025 80
TOTAL 80 1.0000
Si describimos el ejemplo por medio de un polígono de frecuencias podemos decir lo siguiente:
Para determinar, por ejemplo, el precio de venta debajo del cual se vendió la mitad de las bicicletas,
trazamos una línea horizontal sobre el 50% de las bicicletas vendidas y buscamos la intersección con
el eje “x” que, en este caso, es de 22.5; con esto podemos concluir que el 50% de las bicicletas se
vendieron en menos de $22500.
IPN 34 CECYT-18
ESTANDARÍZATE 1
1. Los siguientes datos muestran la temperatura que alcanzan cierto tipo de aparatos electrónicos
sometidos a una prueba de calidad.
98.6 97.2 97.4 98.6 98.0 98.2 98.2 97.5 98.5 98.8
98.4 98.6 99.6 98.8 98.8 99.0 98.0 98.0 97.3 97.3
97.6 98.6 98.4 98.9 98.0 98.6 98.4 97.8 98.6 97.6
98.7 98.6 98.6 98.7 98.6 98.0 97.0 98.4 98.0 98.6
98.2 97.7 98.0 98.6 99.4 99.5 98.3 97.0 98.4 98.4
a) Construir una tabla de frecuencias
b) Construir un polígono de frecuencias
c) Construir una ojiva menor que y mayor que. ¿Qué porcentaje de aparatos alcanzan una
temperatura menor de 98?2°?, ¿Qué cantidad de aparatos alcanzan temperaturas por encima de los
90°?
2. El siguiente diagrama de tallo y hojas muestra el peso en kg de distintas personas de varias edades.
4 5 9 9
5 2 2 3 7 9
6 0 3 4 6
7 0 3 9
8 1 2 5
9 1 2
Tallo Hojas
a) ¿Cuál es el menor peso registrado en las mediciones?
b) ¿Cuántas personas tienen un peso mayor a los 70kg?
c) ¿Cuántas personas tienen un peso entre 50 y 75kg?
d) ¿Cuántas personas participaron en el estudio?
e) ¿Cuál es el peso promedio de las personas que están entre los 69 y los 86kg?
IPN 35 CECYT-18
3. Enseguida se muestran las duraciones de algunas películas para niños en minutos. Construya un
diagrama de tallo y hojas.
a) ¿Qué porcentaje de películas tienen una duración menor a 85 minutos?
b) ¿Qué porcentaje de la duración de las películas tienen una duración de 76 a 90 minutos?
83 88 120 64 69 71 77 71 90 77
75 79 80 78 78 83 76 75 75 75
72 82 74 84 90 89 82 81 76 73
82 89 82 74 86 76 82 75 80 92
75 64 73 74 71 94 74 84 79 70
4. El siguiente conjunto de datos muestra las calificaciones de un grupo de estudiantes de bachillerato

en la unidad de aprendizaje de cálculo integral.
a) Construye una tabla de distribución de frecuencias que incluya la siguiente información
Clase Frecuencia Frecuencia Frecuencia Frecuencia

absoluta acumulada relativa relativa
absoluta acumulada
8 8 4 10 10 5
10 7 5 7 6 7
8 7 5 10 6 8
10 8 7 8 1 2
2 4 8 9 8 7
10 10 7 8 9 9
9 7 5 7 7 5
3 8 9 5 10 9
10 8 8 10 5 8
b) ¿Qué porcentaje de estudiantes obtuvieron calificación mayor a 8?
c) ¿Qué porcentaje de estudiantes obtuvieron calificación entre 6 y 8?
d) De acuerdo con la tabla de distribución, ¿hay una concentración de las calificaciones en

torno a algún valor? De ser así, indíquelo.
IPN 36 CECYT-18
5. Los siguientes datos son tiempos de ignición para ciertos materiales de tapicería expuestos
a una flama (dados a la centésima de segundo más cercana)
a) Construye una tabla de frecuencias.
b) Construye una gráfica que ilustre las frecuencias acumuladas.
c) ¿Qué porcentaje de los materiales encienden a menos de 2.5?
2.58 4.04 1.58 2.2 2.51 6.43 4.32 4.19

4.79 1.52 3.87 5.12 6.2 1.38 4.54 5.15
5.5 4.56 6.9 2.11 5.92 2.46 1.47 2.32
6.75 8.8 4.72 2.46 5.84 7.4 3.62 8.75
2.65 4.71 9.45 1.42 7.86 6.25 12.8 1.92
7.6 5.92 5.09 6.37 8.79 9.65 4.11 5.4
11.25 5.33 7.41 10.6 3.9 8.64 7.9 3.81
3.78 3.1 1.7 3.24 3.75 6.43 6.42 1.79
4.9 6.77 9.7 4.5 3.49 5.62 5.11 2.5
5.21 9.2 6.85 7.35 1.76 1.2 2.8 11.75
6. Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra
aleatoria simple de 40 hombres y 40 mujeres. Los médicos utilizan el pulso para medir la
salud de los pacientes; por ejemplo, si el pulso es muy alto se podría catalogar como una
infección o deshidratación.
a) Construye un polígono de frecuencias relativas para hombres y mujeres (en una misma
gráfica) y responde ¿qué puedes decir sobre los latidos de los hombres y las mujeres?
HOMBRES
68 64 88 72 65 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 56 64 72
MUJERES
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 60 75
IPN 37 CECYT-18
Medidas de tendencia central para datos no agrupados
Las medidas de tendencia central o promedios pueden ser usados en una gran variedad de contextos
y se considera que forman parte de la base de la estadística. Estas medidas de tendencia central nos
permiten describir las principales características de los datos analizados.
Gran parte de los conjuntos de datos, tienen una tendencia a agruparse alrededor de un punto central
y, de este modo, podemos elegir un valor que describa todo un conjunto de datos; luego, un valor
descriptivo como ese es una medida de tendencia central o “posición”. Las medidas de tendencia
central son:
Media Aritmética
Mediana
Moda
MEDIA (Media Aritmética)

Sea un conjunto de datos que consiste de n observaciones: x 1 , x 2 , x 3 , ..., x n ; entonces, la media
es el promedio de los números en la muestra, es decir:
n
1 x1  x2  x 3  ...  xn
X
n x
i 1
i

n
La media representa el valor promedio en el conjunto de valores observados en la muestra e intenta

resumir las características de un conjunto de valores.
OBSERVACIONES SOBRE LA MEDIA

La media aritmética se puede calcular para cualquier conjunto numérico.
La suma de las desviaciones o diferencias respecto a la media aritmética es cero, es decir
n
d  (x  X )  0 .
i
i 1
i
Considere las calificaciones del área de matemáticas de Víctor que son: 6, 8, 7, 7, 6, 8. El promedio
687768
de sus calificaciones será X   7 . Así, la suma algebraica de las desviaciones
6
        
será: d  6  7  8  7  7  7  7  7  6  7  8  7  0   
IPN 38 CECYT-18
Es muy sensible a los valores extremos, por ejemplo, observe los siguientes conjuntos de datos:
Ismael 34 años
Claudio 15 años
Carlos 9 años
Julieta 15 años
Jacobo 8 años
Frida 14 años
Toribio 9 años
Sebastián 16 años
Total 60
Total 60
15  15  14  16 60
La media para la primera tabla será: X    15 años y para el segundo caso
4 4
34  9  8  9 60
X   15 años.
4 4
Observe que en ambos casos la media vale 15 años, pero en la segunda tabla, la edad de Ismael eleva
mucho el promedio, de modo que, la media es muy sensible a valores extremos.
Ejemplo: Calcule la media para el siguiente conjunto de datos e interprete el valor

obtenido.
La siguiente tabla de datos nos muestra las calificaciones de un grupo de estudiantes de Cálculo
Diferencial. Encuentre la media para dicho grupo de datos e interprete su significado.
Núm Nombre Calificación final Núm Nombre Calificación final

1 Diego armando 5 9 Guadalupe 7
2 Jorge ángel 7 10 Natalia 5
3 Cinthia Lizbeth 8 11 Iván 5
4 Andrea Scarlett 6 12 Galilea 7
5 Eduardo 7 13 Marcelo 6
6 Marlon 10 14 Jethzabel 7
7 Teresa 10 15 Armando 8
8 Naomi 6 16 Alondra 6
9 Guadalupe 7 17 Elisabet 9
5  7  8  ...  6  9 119
La media del conjunto de datos está dada por X    7 , lo que
17 17
significa que, el promedio en las calificaciones obtenidas por los estudiantes del curso de
Cálculo Diferencial es de 7.
IPN 39 CECYT-18
MEDIANA
La mediana se define como aquel valor de la variable que supera a no más de la mitad de las
observaciones y al mismo tiempo, es superada por no más de la mitad de las observaciones, en otras
palabras, se puede definir como el valor central de un conjunto de datos.
Si se tiene un número impar de valores, la mediana es el valor central.
Si se tiene un número par de valores, la mediana es el promedio de los valores centrales.
OBSERVACIONES SOBRE LA MEDIANA
Los datos deben estar ordenados de menor a mayor o de mayor a menor.

Hay situaciones en que la única medida de tendencia central que puede utilizarse es la
mediana. (¿cualitativos?)
La mediana no depende de la magnitud de los datos, depende sólo del número de ellos.
Ejemplo: Calcule la mediana para el siguiente conjunto de datos e interprete el

valor obtenido.
120 3 14 1 99 7 30 2000 16
Ordenamos en primer lugar los valores de menor a mayor y como el número de datos es impar, la
mediana será el valor central, es decir, la mediana es el quinto dato ordenado que divide a la serie
en dos grupos de 4 datos cada uno. Por tanto, M e  1 6 .
1 3 7 14 16 30 99 120 2000
Ejemplo: Las siguientes observaciones representan el punto de ebullición de un

compuesto a base de silicio (en grados Celsius). Calcule la mediana del conjunto de
mediciones.
166 141 136 153 170 162 155 148 132 160 175 150
Ordenamos en primer lugar los valores de menor a mayor y como el número de datos es par, la
153  155
mediana será Me   154 .
2
132 136 141 148 150 153 155 160 162 166 170 175
IPN 40 CECYT-18
MODA
La moda se define como el valor que se presenta con la más alta frecuencia (el valor que más
se repite) en un conjunto de datos.
Un conjunto de datos puede tener más de una moda (2 modas-bimodal, 3 modas-multimodal)
OBSERVACIONES SOBRE LA MODA
La moda es la única medida de tendencia central que puede ser utilizada con datos
cualitativos. Por ejemplo, el color favorito de un grupo de estudiantes.
La moda puede ser única, haber dos modas en un conjunto de datos o bien, existir
varias modas. También es posible que un conjunto de datos no tenga moda.
Ejemplo: El siguiente conjunto de datos, muestra el porcentaje obtenido de

oxígeno disuelto al tomar muestras en un río al ser medido 36 veces. Calcule la
moda del conjunto de datos.
7.3 6.9 6.4 6.3 3.6 6.1 8.9 7.3 6.7 4.1 7.4 8.3
3.5 7.3 8.2 5.6 7.6 7.2 4.2 5.7 5.3 7.3 6.6 7.3
7.9 4.7 7.9 6.0 7.3 7.3 6.5 6.3 6.5 6.0 6.0 7.7
Observando los valores medidos de oxígeno disuelto se tiene que la moda o el valor más
típico o valor modal es 7.3%.
IPN 41 CECYT-18
Medidas de tendencia central para datos agrupados
Cuando tenemos un conjunto de datos resumidos en una tabla de frecuencias, no sabemos

con exactitud los valores que caen dentro de una clase en particular. Entonces, se supone
que en cada clase todos los valores muéstrales son iguales a las marcas de clase. ¿Qué significa
esto? Revisemos el siguiente ejemplo:
La siguiente tabla nos muestra la cantidad de mensajes por WhatsApp que envían estudiantes
de bachillerato durante una semana a otros compañeros, amigos, miembros familiares, etc.
Clase i Conteos de me nsajes Frecuencia absoluta f i

por WhatsApp
Estudiantes
1 0-99 46
2 100-199 90
3 200-299 40
4 300-399 7
5 400-499 3
Total
f i
 186
La tabla nos muestra en la primera línea que 46 estudiantes enviaron entre 0-99 mensajes
por WhatsApp, mientras que, en la segunda línea, 90 estudiantes enviaron entre 100 y 199
mensajes y así sucesivamente.
Tenemos el número de estudiantes, pero en este caso no contamos con la cantidad exacta de
mensajes que envió cada uno; en alguno otro caso sí se conoce, pero al agruparlos quedan
registrados en un cierto intervalo de datos.
IPN 42 CECYT-18
MEDIA (Media Aritmética)
Para calcular la media de un conjunto de datos agrupados calculamos: X 

 (f  x )
i i
f i
Para ilustrar el uso de la fórmula para el cálculo de la media analicemos el ejemplo anterior:
Observe que como no tenemos el valor exacto de mensajes que envió cada uno de los 46
estudiantes debemos tomar una marca de clase que represente a todo el intervalo, de modo
que se genera la columna “Marca de clase” que será el valor que represente a toda la clase.
CÁLCULO DE LA MEDIA A PARTIR DE UNA DISTRIBUCIÓN DE

FRECUENCIAS
Conteos de Frecuencia f i Marca de clase xi
mensajes por (Número de estudiantes fi  x i
que caen en ese intervalo)
Ext sup  Ext inf
WhatsApp
2
0-99 46 49.5 2277
100-199 90 149.5 13455
200-299 40 249.5 9980
300-399 7 349.5 2446.5
400-499 3 449.5 1348.5
Totales

fi  186 
( fi  x i )  29507
Así, es cálculo de la media aritmética para el conjunto queda terminada por la expresión
X 
 (f  x )  29507  158.64
i i
f i
186
Por lo tanto, podemos señalar que en promedio cada estudiante envía 159 mensajes por
WhatsApp semanalmente.
IPN 43 CECYT-18
Ejemplo: Se realizó una encuesta sobre el número de hijos por hogar en el
municipio de Miahuatlan de Díaz, Oaxaca. Calcula la media del número de hijos
por familia.
CÁLCULO DE LA MEDIA DEL NÚMERO DE HIJOS

POR FAMILIA
Hijos por familia Frecuencia f i Productos
(Número de familias que fi  x i
caen en ese intervalo)
0 2 0
1 4 4
2 4 8
3 5 15
4 3 12
TOTAL
f i
 18  (f  x )  39
i i
Tenemos entonces que el promedio de hijos es X 

 (f  x )  39  2.16  2 hijos.
i i
 f 18 i
IPN 44 CECYT-18
MEDIANA
Para calcular la mediana de un conjunto de datos agrupados, recuerde en el caso de datos no
agrupados la mediana es el dato que se encuentra a la mitad ya ordenando los datos de menor a
mayor o viceversa.
En el caso de datos agrupados, tenemos una tabla de frecuencias de modo que la mediana será
n
 Fi 1
calculada del siguiente modo: Me  Li 
2 A
fi
Me : es la mediana de los datos agrupados.
n : Número de datos
Li : Límite inferior del intervalo de la mediana
Fi1: Frecuencia acumulada anterior al intervalo de la mediana
fi : Frecuencia absoluta del intervalo de la mediana
A : Amplitud del intervalo y se define como A  Esup  Einf
Forma de calcular la mediana para datos agrupados:
Construimos una columna de frecuencias acumuladas que llamaremos Fi (Frecuencia

acumulada).
¿Cuál es la clase en la que se encuentra la mediana? Dividimos el total de las
frecuencias absolutas ( f i ) entre dos.
Al buscar el valor obtenido de dividir el numero total de las frecuencias absolutas f i
entre dos, nos vamos a las frecuencias acumuladas y nos situamos en el primer valor
que sea mayor que el que hemos obtenido.
Determinamos la clase de la mediana, o bien, el intervalo donde cayó el valor que
obtuvimos.
Calculamos la mediana con la expresión para calcular la mediana
n
 Fi 1
Me  Li  2 A
fi
Para ilustrar o anterior, revisemos el siguiente ejemplo:
IPN 45 CECYT-18
Ejemplo: La siguiente tabla muestra la distribución de frecuencias de la duración,
en horas, de uso continuo de 212 dispositivos electrónicos iguales, sometidos a cierta
prueba de control. Calcula la mediana y la media del conjunto de datos.
CÁLCULO DE LA MEDIA Y LA MEDINANA DE LA DURACIÓN DE

DISPOSITIVOS EN USO CONTINUO
Duración en Frecuencia f i Marca de Clase Frecuencia
horas (Número de Ext sup  Ext inf fi  x i Acumulada
xi dispositivos que Fi
2
caen por
intervalo)
[350-400) 4 375 1500 4
[400-450) 6 425 2550 10
[450-500) 9 475 4275 19
[500-550) 20 525 10500 39
[550-600) 31 575 17825 70
[600-650) 80 625 50000 150
[650-700) 42 675 28350 192
[700-750) 10 725 7250 202
[750-800) 8 775 6200 210
[800-850) 2 825 1650 212
TOTAL
f i
 212  (f  x )  130100
i i
PARA CALCULAR LA MEDIANA:
1. Construimos la columna de frecuencia absoluta acumulada ( Fi ) a partir de las frecuencias

absolutas ( f i ).
212
2. Sumamos las frecuencias absolutas ( f i ) y dividimos entre 2, es decir:  106 .
2
3. El valor 106 se sitúa en el intervalo por encima de la frecuencia acumulada correspondiente a
70, es decir, cae en el intervalo de frecuencia acumulada 150 que corresponde al intervalo [600-
650). Este será el intervalo de la mediana.
n 212
 Fi 1  70
4. Calculamos la mediana, es decir: Me  Li  2  A  600  2  50  622 horas.
fi 80
5. La media será: X 
 (f  x )  130100  613.68 horas.
i i
f i
212
IPN 46 CECYT-18
MODA
Para calcular la moda de un conjunto de datos agrupados, recuerde en el caso de datos no agrupados
la moda es el dato que más se repite.
En el caso de datos agrupados, tenemos una tabla de frecuencias, de modo que, la moda será calculada
fi  fi 1
del siguiente modo: Mo  Li  A
( fi  fi 1 )  ( fi  fi 1 )
Mo : es la moda de los datos agrupados.
Li : Límite inferior del intervalo de la moda
fi : Frecuencia absoluta del intervalo de la moda
fi 1 : Frecuencia absoluta anterior al intervalo de la moda
fi 1 : Frecuencia absoluta posterior al intervalo de la moda
A : Amplitud del intervalo de la moda y se define como A  Esup  Einf
Para calcular la moda en conjuntos de datos agrupados:
Observamos las frecuencias absolutas f i y tomamos aquella que es la más grande, es decir,
seleccionamos el intervalo donde se encuentra la frecuencia absoluta más grande.
fi  fi 1
Calculamos Mo  Li  A
( fi  fi 1 )  ( fi  fi 1 )
Para ilustrar o anterior, revisemos el siguiente ejemplo:
Para calcular la moda, observe que el Intervalo con mayor

Intervalo de Frecuencia
cantidad de frecuencias absolutas corresponde al de 7-7.8.
clase Absoluta
fi
De modo que nuestros datos para calcular la moda serán:
5.2-6 3
6.1-6.9 5 fi  fi 1
7-7.8 9 Mo  Li  A
( fi  fi 1 )  (fi  fi 1 )
7.9-8.7 7
8.8-9.6 5
95
7  (7.8  7)
9.7-10.5 3 (9  5)  (9  7)
TOTAL 32 4
7  0.8  7.533
42
IPN 47 CECYT-18
Sesgo
Una comparación de la media, la mediana y la moda puede mostrarnos algunas características del
sesgo en un conjunto de datos.
Sesgo. Una distribución de datos es sesgada si no es simétrica y se extiende más

hacia un lado que hacia otro. Por otra parte, una distribución de datos se dice simétrica
si la mitad izquierda de su histograma es aproximadamente una imagen de la mitad
derecha.
Cuando analizamos un conjunto de datos, podemos analizar el sesgo de las siguientes formas:
Sesgo negativo. Los datos sesgados hacia la izquierda dan como resultado una curva con
cola hacia la izquierda más larga y, en este caso, la media y la mediana se encuntran a la
izquierda de la moda.
Sesgo positivo. Los datos sesgados hacia la derecha dan como resultado una curva con cola
hacia la derecha más larga y, en este caso, la media y la mediana se encuntran a la derecha
de la moda.
Simétrica. En el caso de los datos que son simétricos (sesgo cero), la media, la mediana y
la moda son iguales.
Sesgo negativo Sesgo cero (Simétrica) Sesgo positivo
En la práctica, generalmente las distribuciones son aproximadamente simétricas; además, es

más común tener un sesgo hacia la derecha ya que, es más fácil obtener valores a la derecha
que a la izquierda, por ejemplo, en una distribucion de ingresos anuales es imposible tener
ingresos menores que cero pero sí puede ocurrir que haya quien gane millones al año.
IPN 48 CECYT-18
Ejemplo: Para el siguiente conjunto de datos agrupados, calcula la media, la
mediana y la moda.
Premios de la Academia: edades de las mejores actrices

Edad de las Frecuencia Marca de Clase Frecuencia
actrices al absoluta f i (xi ) fi  x i Acumulada
ganar su Fi
(Número de Ext sup  Ext inf
primer oscar actrices por xi 
2
intervalo)
21-30 28 25.5 714 28
31-40 30 35.5 1065 58
41-50 12 45.5 541.8 70
51-60 2 55.5 111 72
61-70 2 65.5 131 74
71-80 2 75.5 151 76
TOTAL
f i
 76  (f  x )  2713.8
i i
PARA CALCULAR LA MEDIA:
La media será X 
 (f  x )  2713.8  35.707  36
i i
f 76
i
Por tanto la edad promedio en que se gana un premio a mejor actriz es a los 36 años.
PARA CALCULAR LA MEDIANA:
n 76
 Fi 1  28
La mediana de acuerdo a la tabla de datos será Me  Li  2  A  31  2  9  34
fi 30
34 años es el valor central de las edades y de ahí el 50% de los datos corresponden a edades menores
a 34 años y el 50% están por enzima de los 34 años.
PARA CALCULAR LA MODA:
La moda de acuerdo a la tabla de datos será

fi  fi 1 30  28
Mo  Li   A  31  (40  31)  31.9  32
( fi  fi 1 )  ( fi  fi 1 ) (30  28)  (30  12)
Por tanto, la edad en la que más actrices reciben un premio de la academia es a los 32 años.
IPN 49 CECYT-18
ESTANDARÍZATE 2
1. El siguiente conjunto de datos muestra los pesos en kg de los estudiantes de un grupo de

Cálculo Integral de bachillerato. Calcula la media ( X ), la mediana ( Me ) y la moda ( Mo ).
NOMBRE PESO NOMBRE PESO NOMBRE PESO

Alan 66 René 62 Pablo 60
Sebastián 65 Pablo 70 Rogelio 64
Ángel 73 Francisco 81 Valeria 56
Miguel 65 Us 82 Eduardo 59
Deyanira 60 Joselin 60 Maziel 72
Carolina 56 Eduardo 56 Ramón 53
Jasha 55 David 60 Oscar 70
2.- El siguiente gráfico nos muestra las calificaciones obtenidas por estudiantes de un curso
de geometría analítica, ¿Se puede obtener la moda a partir del gráfico?, si es sí, encuéntrala.
12
10 10 10 10 10 10 10
10 9 9 9 9
8 8 8 8
8 7 7 7 7 7 7 7 7
6 6 6 6 6
6 5 5 5
4
2 2
2 1 1
3. La florería “Robarte” ha vendido en una semana las plantas que se muestran a

continuación. ¿Cuál es tipo de planta más vendida?, ¿Por qué?
Planta Alcatraz Cuna de Rosal rojo Begonia Lilas Gardenia

Moisés
Piezas 16 21 30 18 29 10
Vendidas
IPN 50 CECYT-18
4. Calcula la media aritmética para los ingresos mensuales en pesos de un grupo de personas
que trabajan para la empresa “Emerton”.
Ingresos (x1000) Número de

personas fi
[26,34) 1
[34,42) 2
[42,50) 4
[50,58) 10
[58,66) 16
[66,74) 8
[74,82) 3
[82,90) 1
5. Los siguientes datos corresponden al porcentaje de algodón en el material usado en la fabricación

de playeras.
34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6
33.1 34.7 34.2 33.6 36.6 33.1 37.6 33.6

34.5 35.0 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.4 34.7 34.1 34.6 35.9 34.6 34.7
34.3 36.2 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.8 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.1 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.3 34.9 36.4 34.1 33.5 34.5 32.7
a) Calcule la media, mediana y moda como datos no agrupados; posteriormente, calcule la media
mediana y moda como datos agrupados.
b) ¿Qué porcentaje de las playeras contienen más de 36% de algodón en el material usado para su
elaboración?
c) Construya un histograma y responda ¿Cuál de las tres medidas de tendencia central modela mejor
el comportamiento de los datos?
IPN 51 CECYT-18
6. La siguiente tabla muestra los ingresos anuales de un grupo de jugadores profesionales de Baseball.
Calcula la media, la mediana y la moda.
Ingresos (x $1000) Número de

jugadores fi
30 180
50 100
100 50
500 20
1,000 10
2,000 15
3,000 15
5,000 10
a) ¿Qué cantidad de jugadores ganan por encima de la media anualmente?

b) ¿Cuál o cuáles de las medidas de tendencia central representan mejor los ingresos anuales de
los jugadores?
7. La siguiente tabla muestra las cantidades de nicotina en mg para una muestra de cigarrillos con
filtro y si filtro.
Sin 1.1 1.7 1.7 1.1 1.1 1.4 1.1 1.4 1.0 1.2 1.1 1.1 1.1
filtro
1.1 1.1 1.8 1.6 1.1 1.2 1.5 1.3 1.1 1.3 1.1 1.1 1.6
Con 0.4 1.0 1.2 0.8 0.8 1.0 1.1 1.1 1.1 0.8 0.8 0.8 0.8
filtro
1.0 0.2 1.1 1.0 0.8 1.0 0.9 1.1 1.1 0.6 1.3 1.1 0.6
a) Calcule la media, la mediana y la moda para ambos tipos de datos.
b) Al parecer, ¿los filtros son efectivos para reducir la cantidad de nicotina?
IPN 52 CECYT-18
Medidas de posición
En muchos estudios estadísticos, necesitamos saber el valor por debajo del cual está una
determinada fracción de los datos; por ejemplo, si se tienen las calificaciones de un grupo de
estudiantes en una determinada unidad de aprendizaje, supóngase que se quiere conocer la
calificación por debajo de la cual se encuentran el 40% de los estudiantes. Así, además de la
mediana, que divide en dos mitades a un conjunto de datos, se pueden considerar otros
puntos de división. Uno de esos métodos consiste en determinar la ubicación de los valores
que dividen un conjunto de observaciones en partes iguales. Estas medidas incluyen los
cuartiles (Qk ), deciles ( Dk ) y percentiles ( Pk ) que analizaremos a continuación.
Cuartiles (Qk ) para datos no agrupados
Los cuartiles son números que dividen a un conjunto de datos en cuatro partes iguales.
El cuartil uno Q1, es el punto por debajo del cual se ubica el 25% de los datos.
El cuartil dos Q2 , el es punto por debajo de cual se ubica el 50% de los datos . Este coincide
con la mediana.
El cuartil tres Q3 , es el punto por debajo del cual se ubican el 75% de los datos.
Para el cálculo de los cuartiles se debe considerar lo siguiente:
Ordenar los datos de menor a mayor

Encuentra la mediana de los datos. Esta corresponde con el segundo cuartil (Q2 ).
Encuentra la mediana de la parte inferior del conjunto de datos. Esta corresponde con el
primer cuartil (Q1).
Encuentra la mediana de la parte superior del conjunto de datos. Esta corresponde con el
tercer cuartil (Q3 ).
IPN 53 CECYT-18
Ejemplo: La siguiente tabla nos muestra los datos del tiempo en horas que 20 personas destinan a
ver el televisor semanalmente. Determina en interpreta los cuartiles para el conjunto de datos.
25 41 27 32 43
66 35 31 15 5
34 26 32 38 16
30 38 30 20 21
PASO 1. Ordenamos los datos de menor a mayor
5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66
PASO 2. Calculamos la mediana del conjunto total de datos. En este caso, tenemos 20 datos de
modo que, la mediana será el promedio de los valores en las posiciones centrales 10 y 11, es decir,
30  31
Me  Q2   30.5 que coincide con el cuartil dos.
2
PASO 3. Dividimos los datos ordenados en dos partes, la parte superior y la parte inferior. Si el
número de observaciones es impar, se incluye la mediana en ambas mitades.
5 15 16 20 21 25 26 27 30 30 31 32 32 34 35 38 38 41 43 66
Mitad inferior Mitad superior
PASO 4. Encontramos la mediana del conjunto de datos de la mitad inferior. Este valor coincide
21  25
con el primer cuartil (Q1), es decir, Q1   23 .
2
PASO 5. Encontramos la mediana del conjunto de datos de la mitad superior. Este valor coincide
35  38
con el tercer cuartil (Q3 ), es decir, Q3   36.5 .
2
Por lo tanto, vemos que el 25% de las personas ven menos de 23 horas, 25% de las personas ven
televisión entre 23 y 30.5 horas, 25% de las personas miran entre 30.5 y 36.5 horas y el 25% de las
personas ven más de 36.5 horas semanales.
IPN 54 CECYT-18
Otra manera de calcular los cuartiles de un conjunto de datos no agrupados, considera el siguiente
procedimiento:
Primero agrupamos los datos.

Determinamos el valor de la fracción de los n datos que corresponde al cuartil que queremos
calcular, es decir, PQ  n  Qk , donde PQ es la posición correspondiente a la proporción
k k
buscada de los datos, n es el número total de datos y Qk es el cuartil buscado en decimal

(25% al 0.25, 50% al 0.5 y 75% al 0.75).
Finalmente, dependiendo del valor resultante de PQ  n  Qk , tenemos que:
k
PQ  PQ
Si PQ  n  Qk (posición) es entera, entonces, el valor será Qk  k k 1
( PQ y
k 2 k
PQ se sustituyen por los valores en los datos).

k 1
Si PQ  n  Qk no es entero, entonces, Qk  PQ   1, donde PQ  representa la

k  k  k
parte entera de PQ .
k
Ejemplo: Determina e interpreta los cuartiles 0.25 y 0.50 para 19 mediciones sobre velocidades de
viento máximas en millas por hora para tormentas tropicales en el Atlántico.
Máximas velocidades de viento en millas por hora para tormentas tropicales

60 60 105 45 70 110 80 90 85 45 115 115 65 80 90 50 100 40 50
PASO 1. Ordenamos los datos de menor a mayor
40 45 45 50 50 60 60 65 70 80 80 85 90 90 100 105 110 115 115
PASO 2. Determinamos el valor de la fracción de los n datos (19 datos) que corresponde al
cuartil que queremos calcular, es decir, PQ  n  Qk  (19)(0.25)  4.75
k
PASO 3. Como no es entero, tomamos la parte entera de 4.75 que será 4 y le sumamos 1 de acuerdo
con Qk  PQ   1, luego, P0.25  5 (posición) que revisando los datos corresponde al valor
 k
50. Esto significa que 25% de las velocidades, están por debajo de 50mph
Para el cuartil 0.50, multiplicamos (19)(0.50)  9.5 ; luego, como no es entero, tomamos la parte
entera y le sumamos 1, con lo que obtenemos que el cuartil 0.50 corresponde a la posición
10 que será 80. Esto significa que 50% de las velocidades de los vientos está por debajo de
80mph .
IPN 55 CECYT-18
Cuartiles (Qk ) para datos agrupados
Para el caso de datos agrupados, calcularemos el valor de cada uno de los cuartiles de la siguiente
forma:
Debemos calcular en la tabla de distribución de frecuencias la columna correspondiente a la

frecuencia absoluta acumulada ( Fi ).
k n
Para la posición del cuartil calculamos PQ  , k  1,2,3 (según el cuartil)
k 4
 k n 
  Fi 1 
4
Luego, para el valor del cuartil tenemos que Qk  Li   A
 fi 
 
 
Donde:
Li es el límite inferior del intervalo donde se encuntra Qk

fi es la frecuencia absoluta del intervalo donde se encuentra Qk
Fi1 es la frecuencia absoluta acumulada anterior al intervalo donde se encuentra Qk
A es la amplitud del intervalo donde se encuentra
n es el número de datos.
k  1,2,3 es el número de cuartil que se desea calcular.
Ejemplo: Calcular los cuartiles para la siguiente tabla de datos agrupados:
Tiempo
Frecuencia fi Frecuencia
(minutos)
acumulada Fi
[30-35) 3 3
[35-40) 7 10
[40-45) 12 22 Q1
[45-50) 23 45 Q 2 , Q3
[50-55) 14 59
[55-60) 1 60
60
Total
IPN 56 CECYT-18
Calculamos las posiciones de los cuartiles:
1  60
Para el cuartil uno tenemos que PQ   15 . Luego, el 25% de las observaciones
1 4
 1  60 
  10 
4
se hayan a la izquierda de Q1  40   (45  40)  42.08 minutos.
 12 
 
 
2  60
Para el cuartil dos tenemos que PQ   30 . Luego, el 50% de las observaciones
2 4
 2  60 
  22 
4
se hayan a la izquierda de Q2  45   (50  45)  46.739 minutos.
 23 
 
 
3  60
Para el cuartil tres tenemos que para la posicion PQ   45 . Luego, el 75% de
3 4
 3  60 
  22 
4
las observaciones se hayan a la izquierda de Q3  45   (50  45)  50
 23 
 
 
De modo que el 25% de los datos se encuentran por debajo de 42.08 minutos, el 50% de los
datos se encuentran por debajo de 56.304 minutos y el 75% de los datos se encuentra por
debajo de 50 minutos.
IPN 57 CECYT-18
Deciles ( Dk ) para datos no agrupados y agrupados
Son una de las medidas de posición y constan de 9 valores que dividen un conjunto de datos
en diez partes iguales. Los deciles determinan los valores 10%, 20%, 30%,…, 90% de los datos,
donde el D5 coincide con la mediana Me y con el segundo cuartil Q2 .
Para calcular los deciles, sigamos la siguiente metodología:

Determinamos el valor de la fracción de los n datos que corresponde al decil que queremos
calcular, es decir, PD  n  Dk , donde PD es la posición correspondiente a la proporción
k k
buscada de los datos, n es el número total de datos y Dk es el decil buscado en decimal (10%
al 0.1, 20% al 0.2, etc).
Finalmente, dependiendo del valor resultante de PD  n  Dk , tenemos que:
k
PD  PD
Si PD  n  Dk (posición) es entera, entonces, el valor será Dk  k k 1
( PD y
k 2 k
PD se sustituyen por los valores en los datos).

k 1
Si PD  n  Dk no es entero, entonces, Dk  PD   1 , donde PD  representa la

k  k  k
parte entera de PD .
k
Ejemplo: La siguiente tabla muestra las calificaciones obtenidas por 20 estudiantes en la

materia de Cálculo Integral. Encontrar el D1,D5,D9 .
Calificaciones de 20 estudiantes en Cálculo Integral

25 28 30 30 35 35 36 37 37 38 40 40 40 40 40 40 41 43 48 50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Para el Decil uno calculamos PD  (0.10)(20)  2 , entonces, el valor es entero y por

1
28  30
tanto el decíl uno será D1   29 .
2
IPN 58 CECYT-18
Para el Decil cinco calculamos PD  (0.50)(20)  10 , entonces, el valor es entero y por
5
38  40
tanto el decíl cinco será D5   39 .
2
Para el Decil nueve calculamos PD  (0.90)(20)  18 , entonces, el valor es entero y

5
43  48
por tanto el decíl nueve será D9   45.5 .
2
De estos hechos podemos concluir que el 90% de los estudiantes obtuvieron menos de 45.5;
el 50% de los estudiantes obtuvieron menos de 39 y sólo el 10% de los estudiantes obtuvieron
calificación mayor que 45.5 lo que representa un alto índice de reprobación.
Para el caso de datos agrupados, calcularemos el valor de cada uno de los cuartiles de la siguiente
forma:

frecuencia acumulada ( Fi ).
k n
Para la posición del decil calculamos PD  , k  1,2,3,...,9 (según el decil)
k 10
 k n 
  Fi 1 
10
Luego, para el valor del decil tenemos que Dk  Li   A
 fi 
 
 
Donde:
Li es el límite inferior del intervalo donde se encuntra Dk

fi es la frecuencia absoluta del intervalo donde se encuentra Dk
Fi1 es la frecuencia absoluta acumulada anterior al intervalo donde se encuentra Dk
A es la amplitud del intervalo donde se encuentra
n es el número de datos.
k  1,2,3,...,9 es el número de decil que se desea calcular.
IPN 59 CECYT-18
Ejemplo: Se toma una muestra de 40 personas en un hospital en el área de urgencias para
medir el tiempo en que son atendidas. Se desea saber qué tiempo tarda el hospital en atender
al 30% y al 70% de las personas que acuden por una urgencia.
Tiempo en minutos Personas atendidas Frecuencia Ubicación del

(Frecuencias) acumulada decil
7.1-8.1 9 9
8.2-9.2 12 21 D3
9.3-10.3 9 30
10.4-11.4 9 39 D7
11.5-12.5 5 44
12.6-13.6 2 46
13.7-14.7 1 47
14.8-15.8 3 50
TOTAL 50
3  50
Para el decil tres tenemos que PD   15 . Luego, el 30% de las observaciones
3 10
 3  50 
  9
10
se hayan a la izquierda de D2  8.2   (9.2  8.2)  8.7 minutos.
 12 
 
 
7  50
Para el decil siete tenemos que para la posicion PD   35 . Luego, el 75% de las
7 10
 7  50 
  30 
10
observaciones se hayan a la izquierda de D7  10.4    (11.4  10.4)  10.955
 9 
 
 
De modo que el 30% de los pacientes son atendidos en menos de 8.7 minutos y el 70% se
atienden en menos de 10.955 minutos, mientras que, el 30% se atienden en más de 10.955
minutos.
IPN 60 CECYT-18
Percentiles ( Pk ) para datos no agrupados y agrupados
Se definen como los intervalos dentro de los cuales quedan proporcionalmente repartidos los
datos sin agrupar, o bien, agrupados en una distribución formada por cien partes iguales.
Se tienen 99 percentiles que se simbolizan por Pk , en donde cada uno contendrá el mismo
número de datos, es decir, el 1% del total.
El primer percentil es el valor que indica en el cual, o por debajo del cual, queda el 1% de
un centésimo de todos los datos y así sucesivamente para todos los percentiles.
Para calcular los percentiles, sigamos la siguiente metodología:
Determinamos el valor de la fracción de los n datos que corresponde al percentil que queremos
calcular, es decir, PP  n  Pk , donde PP es la posición correspondiente a la proporción
k k
buscada de los datos, n es el número total de datos y Pk es el percentil buscado en decimal

(1% al 0.01, 2% al 0.02, 68% al 0.68, etc).
Finalmente, dependiendo del valor resultante de PP  n  Pk , tenemos que:

k
PP  PP
Si PP  n  Pk (posición) es entera, entonces, el valor será Pk  ( PP y
k k 1
k 2 k
PP se sustituyen por los valores en los datos).

k 1
Si PP  n  Pk no es entero, entonces, Pk  PP   1 , donde PP  representa la

k  k  k
parte entera de PP .
k
IPN 61 CECYT-18
Ejemplo: La siguiente tabla muestra las calificaciones obtenidas por 152 estudiantes del
cecyt-18 en la unidad de aprendizaje de probabilidad y estadística. Encontrar el P27,P61,P84 .
Los datos de la siguiente tabla se encuentran ordenados de menor a mayor.
1 1 13 7 25 7 37 7 49 8 61 8 73 8 85 8 97 9 109 9 121 9 133 10 145 10

2 2 14 7 26 7 38 7 50 8 62 8 74 8 86 8 98 9 110 9 122 9 134 10 146 10
3 2 15 7 27 7 39 7 51 8 63 8 75 8 87 8 99 9 111 9 123 9 135 10 147 10
4 2 16 7 28 7 40 7 52 8 64 8 76 8 88 8 100 9 112 9 124 9 136 10 148 10
5 3 17 7 29 7 41 7 53 8 65 8 77 8 89 8 101 9 113 9 125 9 137 10 149 10
6 3 18 7 30 7 42 7 54 8 66 8 78 8 90 8 102 9 114 9 126 9 138 10 150 10
7 5 19 7 31 7 43 8 55 8 67 8 79 8 91 8 103 9 115 9 127 9 139 10 151 10
8 6 20 7 32 7 44 8 56 8 68 8 80 8 92 8 104 9 116 9 128 9 140 10 152 10
9 6 21 7 33 7 45 8 57 8 69 8 81 8 93 8 105 9 117 9 129 10 141 10
10 6 22 7 34 7 46 8 58 8 70 8 82 8 94 9 106 9 118 9 130 10 142 10
11 6 23 7 35 7 47 8 59 8 71 8 83 8 95 9 107 9 119 9 131 10 143 10
12 6 24 7 36 7 48 8 60 8 72 8 84 8 96 9 108 9 120 9 132 10 144 10
Para el percentil 27 calculamos PP  (0.27)(152)  41.04 ; entonces, el valor es

27
decimal y por tanto P27  PP   1  [41.04]  1  41  1  42 que será la posición

  27
buscada y así, el percentil 27 será P27  7 .
Para el percentil 61 calculamos PP  (0.61)(152)  92.72 ; entonces, el valor es decimal

61
y por tanto P61  PP   1  [92.72]  1  92  1  93 que será la posición buscada y así,
  61
el percentil 61 será P61  8 .
Para el percentil 84 calculamos PP  (0.84)(152)  127.68 ; entonces, el valor es

84
decimal y por tanto P84  PP   1  [127.68]  1  127  1  128 que será la posición
 84 
buscada y así, el percentil 84 será P84  9.
De estos datos podemos concluir que el 27% de los estudiantes obtuvieron calificación menor
a 7; el 61% de los estudiantes obtuvieron calificación menor a 8 y el 15.7% obtuvieron 10 de
calificación.
IPN 62 CECYT-18
Para el caso de datos agrupados, calcularemos el valor de cada uno de los percentiles de la
siguiente forma:

frecuencia acumulada ( Fi ).
k n
Para la posición del percentil calculamos PP  , k  1,2,3,...,99 (según el percentil).
k 100
 k n 
  Fi 1 
100
Luego, para el valor del percentil tenemos que Pk  Li   A
 fi 
 
 
Ejemplo: Calcular el percentil P30 y P95 de la siguiente tabla de datos agrupados.
Conteos de mensajes Frecuencia absoluta Frecuencia

por WhatsApp f i (Número de Acumulada Fi
estudiantes que caen en
ese intervalo)
0-99 46 46
100-199 90 136 P30
200-299 40 176
300-399 7 183 P95
400-499 3 186
TOTAL 186
 30  186 
  46 
30  186
Para PP   55.8 . Luego, P30  40   100  (199  100)  50.78
30 100  90 
 
 
minutos.
 95  186 
  176 
95  186 100
Para PP   176.7 . Luego, P95  300    (399  300)  309.9
95 100  7 
 
 
minutos.
IPN 63 CECYT-18
Diagramas de caja y bigotes
Un diagrama de caja y bigotes es una presentación visual que describe características de un conjunto
de datos, como la simetría, mediana, cuartiles Q1, Q2 y Q3 , valores extremos o atípicos y

valores máximo y mínimo. Está compuesto por un rectángulo (caja) y dos líneas horizontales
(bigotes). Si la mediana no está en el centro de la caja, se dice que la distriucion no es simétrica.
Algunos elementos del diagrama de caja son:
Límite superior. Es el extremo superior del bigote. Las opiniones, datos o respuestas por
encima de este se consideran atípicos (poco comunes). Su medida está dada por
Q3  1.5(Q3  Q1)
Límite inferior. Es el extremo inferior del bigote. Las opiniones, datos o respuestas por
debajo de este se consideran atípicos (poco comunes). Su medida está dada por
Q1  1.5(Q3  Q1)
Primer cuartil (Q1). Por debajo de este valor se encuentra como máximo el 25% de los
datos.
Mediana o cuartil dos (Q2 ). Divide la distribución en dos partes iguales. El 50% de las
observaciones están por debajo de la mediana y el 50% está por encima.
Tercer cuartil (Q3 ). Por debajo de este valor se concentran el 75% de los datos.
Valores atípicos. Opiniones o valores que están apartados del cuerpo principal de los datos.
Pueden representar efectos de causas extrañas, opiniones extremas, o bien, errores de
medición o registro. Se considera un valor atípico si:
Dato atípico  Q3  1.5(Q3  Q1)
Dato atípico  Q 1  1.5(Q 3  Q 1 )
Para construir un diagrama de caja y bigotes, se requieren:
1. Los cuartiles 1, 2 y 3.
2. El valor máximo y mínimo (rango intercuartílico Su medida está dada por
IQR  (Q3  Q1)
El rectángulo está dividido por una línea vertical que indica la mediana del conjunto de datos que
indica, además, su relación con el primer y tercer cuartil (recuerde que el segundo cuartil coincide
con la mediana). La caja se ubica a escala sobre un segmento que tiene como extremos los valores
IPN 64 CECYT-18
mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman “bigotes” y los
asteriscos representan datos atípicos o poco comunes.
Ejemplo: Se está probando la eficacia de un nuevo medicamento para mejorar la presión arterial en
personas hipertensas medido en minutos, registrando las siguientes mediciones:
Tiempo en minutos
7.13 5.35 10.14 4.15 5.85 4.69 6.84 0.94 3.45 5.79
5.64 4.92 5.32 6.56 6.17 4.33 6.18 6.50 3.74 2.98
1. El primer paso es ordenar los datos; luego, calcular los elementos para el diagrama de caja y
bigotes, como se muestra en el siguiente diagrama:
Tiempo en minutos (ordenados)

0.94 3.45 4.15 4.69 5.32 5.64 5.85 6.18 6.56 7.13
2.98 3.74 4.33 4.92 5.35 5.79 6.17 6.5 6.84 10.14
El primer cuartil está dado por Q1  4.24

El segundo cuartil que coincide con la mediana está dado por Q2  5.495
El tercer cuartil está dado por Q3  6.34
El rango intercuartílico será IQR  Q3  Q1  6.34  4.24  2.1
El extremo del bigote inferior será E inf  Q1  1.5IQR  4.24  (1.5)(2.1)  1.09
El extremo del bigote superior será E sup  Q3  1.5IQR  6.34  (1.5)(2.1)  9.49
Con la información que hemos calculado, construimos el diagrama de caja y bigotes de

acuerdo con la imagen siguiente:
IPN 65 CECYT-18
Se observa una asimetría en el conjunto de datos ya que, la mediana no está al centro de la caja.
Esto significa que tenemos tiempos más bajos que la mediana y que están más separados del tiempo
promedio o mediana que aquellos que tienen un tiempo mayor al valor de la mediana que están más
agrupados.
¿En qué porcentaje de la población habría hecho efecto el medicamento después de 4.24
minutos? R. 25% de la población.
¿A partir de qué tiempo el medicamento le habría hecho efecto al 50% de la población? R.
5.495 minutos
¿Cuánto tiempo pasó para que el medicamento le hiciera efecto al 100% de la población?
10.14 minutos
¿Cuánto tiempo tardó el medicamento en hacerle efecto a 3/4 de la población? R. 6.34
minutos
Ejemplo: el siguiente diagrama de caja y

bigotes muestra los tiempos de espera en el área
de urgencias de tres hospitales; responde a lo
siguiente:
a) ¿Cuál es el hospital con mayor tiempo o

rango de espera?
Si observamos los diagramas, el primer hospital

tiene un tiempo de espera de 12 minutos (límite
superior menos el límite inferior); el segundo
hospital tiene un tiempo de espera de 16
minutos y el tercer hospital tiene un tiempo de
espera de 24 minutos. Por lo tanto, el hospital
con mayor tiempo de espera para los pacientes
es el tercer hospital.
IPN 66 CECYT-18
b) ¿Cuál hospital minimiza el tiempo de espera?
El hospital que minimiza el tiempo de espera es aquel que tiene menor diagrama de caja y bigotes;
luego, el primer hospital tiene un tiempo mínimo de espera que varía de 2 a 14 minutos (8 minutos),
el segundo hospital tiene un tiempo mínimo de espera de 16 minutos mientras que el tercer hospital
tiene un tiempo de espera de 24 minutos. Por lo tanto, el hospital que minimiza el tiempo de espera
es el hospital número uno.
c) Si se establece un tiempo de espera para atender una urgencia en 8 minutos, ¿Cuál hospital ofrece
mejor servicio de atención?
Al establecer el tiempo de espera de 8 minutos, lo asociamos a la mediana, de modo que, el tercer

hospital está descalificado ya que, establece un tiempo de espera promedio de 12 minutos. Nos
quedamos con los dos primeros hospitales cuyo tiempo promedio de espera es de 8 minutos (la
mediana), de modo que elegiremos aquel hospital que ofrece mejor servicio que va a depender del
tiempo de espera que en este caso, el menor diagrama de caja y bigotes será el primero. Por lo tanto,
el primer hospital es el que ofrece un mejor servicio de atención.
IPN 67 CECYT-18
ESTANDARÍZATE 3
1. Se tiene un conjunto de datos que consiste en las edades de 76 actores en el momento de

ganar un “oscar” en la categoría de mejor película.
a) Uno de los actores tenía 34 años de edad al momento de ganar el oscar y era mayor que 38 de los
otros actores, ¿Cuál es el percentil de la edad 34 años?
b) Uno de los actores tenía 29 años de edad al momento de ganar el oscar y era mayor que 20 de los
c) Uno de los actores tenía 60 años de edad al momento de ganar el oscar y era mayor que 71 de los
2. Se tienen las calificaciones de 30 estudiantes en la unidad de aprendizaje de probabilidad y

estadística dadas por:
27 72 83 15 96 30 8 98 86 5 39 86 87 100 56
88 31 3 30 57 22 7 20 62 95 35 73 66 56 57
a) Calcula el P20 ,Q1 ,Q3 , D5 , D7
b) ¿Qué percentil corresponde a una calificación de 62?
3. La siguiente lista presenta cantidades ordenadas de estroncio-90 (en milibecquereles) de una

muestra aleatoria simple de dientes de leche obtenidos de residentes de Pensilvana nacidos después
de 1979. Construya un diagrama de caja y botes para la información dada.
128 130 133 137 138 142 142 144 147 149
151 151 151 155 156 161 163 163 166 172
a) ¿Cuántos milibecquereles se contienen máximo en los dientes de leche de la primera mitad de la
población?
b) Se considera que una persona desarrollará problemas cardiacos en la edad adulta si han sido
expuestos a cantidades mayores a 150 milibecquereles ¿En qué porcentaje de la población se tendrán
problemas cardiacos futuros?
IPN 68 CECYT-18
4. Los siguientes datos muestran la distribución de frecuencias de la duración en horas de uso continuo
de una muestra de dispositivos electrónicos iguales, sometidos a cierta prueba de control.
a) Calcule P78 , P38 ,Q1 ,Q3 , D9 , D2
b) Construye un diagrama de caja y bigotes.
Duración en Frecuencia f i
horas
[350-400) 4
[400-450) 6
[450-500) 9
[500-550) 20
[550-600) 31
[600-650) 80
[650-700) 42
[700-750) 10
[750-800) 8
[800-850) 2
5. Se tomaron 20 automóviles de forma aleatoria y se midieron las emisiones de carbono en partes

por millón para modelos 1985 y 1995. Construya un diagrama de caja que compare ambas mediciones.
Modelo 1985
141 359 247 940 882 494 306 210 105 880
200 223 188 940 241 190 300 435 241 380
Modelo 1995
140 160 20 20 223 60 20 95 360 70
220 400 217 58 235 380 200 175 85 65
a) ¿Qué puedes decir sobre las emisiones respecto a cada modelo?
b) Si en el modelo 1985 se retiran las 4 mediciones más altas, qué podría decir sobre las emisiones en
ambos modelos.
IPN 69 CECYT-18
Medidas de dispersión
Para describir el comportamiento de una serie de datos que se concentran en una distribución, se
emplean las medidas de tendencia central; para explicar el grado de dispersión o variación de los
datos (qué tan dispersos están respecto a la media) que se expanden alrededor de una medida central,
se utilizan las medidas de dispersión.
Un conjunto de datos puede tener un mismo centro o mediana, pero con aspecto diferente por la
forma en la que los valores se dispersan desde el centro. Por ejemplo, las siguientes distribuciones
de datos se centran ambas en 4, pero hay mucha diferencia en la forma en cómo se dispersan o varían.
En la primera gráfica los datos varían de 3-5 y en la segunda varían de 0-8.
La variabilidad o dispersión es una característica importante en los datos, por ejemplo, si se

fabrican empaques para tornillos, la variación extrema en los diámetros de los empaques producirá
un alto porcentaje de empaques defectuosos. Caso contrario, si estuviéramos tratando de discriminar
entre los buenos y malos estudiantes, un profesor tendría problemas si el examen siempre produjera
calificaciones con poca variación, lo cual, haría complicada la discriminación.
Así, las medidas de variabilidad o dispersión:
Rango o amplitud
Varianza
Desviación estándar
nos pueden servir para crear un panorama sobre la dispersión de un conjunto de datos. Analizaremos
las siguientes medidas de dispersión.
IPN 70 CECYT-18
Rango y amplitud
El rango R de un conjunto de n datos o mediciones se define como la diferencia entre la medición
más grande y la más pequeña, es decir, Rango  Dmayor  Dmenor
Por ejemplo, si consideramos la siguiente tabla que nos muestra los pesos en lb de 30 bebés de
gestación completa al momento de nacer, podemos ver que el rango será Rango  9.4  5.6  3.8lb
7.2 7.8 6.8 6.2 8.2 5.8 6.8 6.8 8.5 7.5
8.0 8.2 5.6 8.6 7.1 6.1 7.9 9.4 9.0 7.8
8.2 7.7 7.5 7.2 7.7 8.5 9.0 7.7 6.7 7.7
Para el caso de datos agrupados hay dos formas de calcular el rango o amplitud:
1. La diferencia entre el límite superior de la clase más alta y el límite inferior de la clase más
baja, es decir, Rango  LSCalta  LICbaja
2. La diferencia entre la marca de clase de la clase superior y la marca de clase de la clase
inferior, es decir, Rango  MCCsup  MCCinf .
Habrá diferencias entre cada uno de los rangos debido a que los límites de la clase se extienden más
que la marca de clase.
El rango o recorrido es útil en situaciones que desean investigar variaciones extremas como la
temperatura máxima y mínima en un día, las velocidades máximas o mínimas en una carretera,
etc. El rango también presenta sus desventajas ya que depende solo de los valores mayor y menor,
por ejemplo:
DETERMINA EL RANGO PARA CADA UNO DE LOS SIGUIENTES CONJUNTOS

A) 7, 9, 10, 11, 14, 16, 19, 22 B) 7, 12, 12, 12, 13, 13, 13, 22
Rango  22  7  15 Rango  22  7  15
X  13.5 X  13
Observe que en ambos casos el rango es 15, sin embargo, existe más variación o dispersión en los
datos del conjunto A, ya que, en los datos del conjunto B se muestran más compactos entre sí.
NOTA: el rango es una medida que sólo toma en cuenta dos datos (máximo y mínimo) y por tanto
se ve afectada por los valores extremos.
IPN 71 CECYT-18
Si observamos los datos anteriores vemos que en la muestra B), tiene sus valores más agrupados
alrededor de la media X  13 , mientras que la muestra A), están más alejados de ella ( X  13.5 ).
Por lo tanto, es necesaria una medida que considere la variabilidad o distancia promedio de los datos
con respecto a su media, es decir, obtener la distancia de cada dato respecto a la media y después
calcular el promedio de esas distancias. Para ello:
A) 7, 9, 10, 11, 14, 16, 19, 22 B) 7, 12, 12, 12, 13, 13, 13, 22
xi (xi  X ) xi (xi  X )
7 7-13.5=-6.5 7 7-13=-6
9 9-13.5=-4.5 12 12-13=-1
10 10-13.5=-3.5 12 12-13=-1
11 11-13.5=-2.5 12 12-13=-1
14 14-13.5=0.5 13 13-13=0
16 16-13.5=2.5 13 13-13=0
19 19-13.5=5.5 13 13-13=0
22 22-13.5=8.5 22 22-13=9
d  0 d  0
Observe en la tabla anterior que la suma de las diferencias en ambos casos es cero, de modo
que, si consideramos los cuadrados en cada una de las diferencias, eliminamos los valores
negativos y podemos calcular los promedios, entonces:
IPN 72 CECYT-18
A) 7, 9, 10, 11, 14, 16, 19, 22 B) 7, 12, 12, 12, 13, 13, 13, 22
xi (xi  X) 2
xi (xi  X)2
7 (7  13.5)2  42.5 7 (7  13)2  36
9 (9  13.5)2  20.25 12 (12  13)2  1
10 (10  13.5)2  12.25 12 (12  13)2  1
11 (11  13.5)2  6.25 12 (12  13)2  1
14 (14  13.5)2  0.25 13 (13  13)2  0
16 (16  13.5)2  6.25 13 (13  13)2  0
19 (19  13.5)2  30.25 13 (13  13)2  0
22 (22  13.5)2  72.25 22 (22  13)2  81
190.25 120
s2   27.178u 2 (Varianza) s2   17.14u 2 (Varanza)
7 7
s  5 .2 1 3 u (Desviación estándar) s  4 .1 4 u (Desviación estándar)
Ahora sí es posible distinguir entre la variación de los datos de un conjunto y el otro de una
manera más precisa haciendo uso de la varianza y de la desviación estándar. Concluimos:
1. La muestra A, tiene 8 datos, su promedio es 13.5, no significa que todos los datos sean
13.5, algunos valen más y otros menos, ¿Qué tanto se aleja cada dato respecto a 13.5?
unos se alejan más, otros menos, pero en promedio se alejan 5.213 unidades que es su
desviación estándar.
2. La muestra B, tiene 8 datos, su promedio es 13, no significa que todos los datos sean 13,
algunos valen más y otros menos, ¿Qué tanto se aleja cada dato respecto a 13? unos se
alejan más, otros menos, pero en promedio se alejan 4.14 unidades que es su desviación
estándar.
IPN 73 CECYT-18
Varianza y desviación estándar para datos no agrupados
En relación a la varianza y a la desviación estándar podemos decir que la varianza no tiene ningún
significado, pues se expresa en unidades cuadradas, de modo que, si hablamos de estudiantes en un
estudio, no tiene sentido hablar de unidades de estudiantes cuadrados; sin embargo, la desviación
estándar viene a definirse como la raíz cuadrada de la varianza y tiene las mismas unidades que los
datos y nos ofrece la variabilidad de los datos respecto a la media.
Desde el punto de vista de la estadística inferencial, el cálculo de la varianza y de la desviación

estándar se calcula bajo las siguientes expresiones:
Varianza de una muestra de datos

s2 
(x  X )
i
2
n 1
Desviación estándar de una muestra es la

medida de variación de los valores respecto a la s
(x  X) i
2
 s2
media. n 1
Donde:
s 2 es la varianza muestral
s es la desviación estándar muestral
xi es el valor de cada observación de la muestra
X es la media de la muestra
n es el número de observaciones de la muestra
IPN 74 CECYT-18
Ejemplo: Los salarios por hora de una muestra de empleados de Zam’s club son: $120, $200,
$160, $180 y $190. Calcula la variación (desviación estándar) de los salarios respecto al
salario promedio de la muestra.
Salarios por hora Diferencias al cuadrado (xi  X)

2
xi
$120 (120  170)2  2500
$200 (200  170)2  900
$160 (160  170)2  100
$180 (180  170)2  100
$190 (190  170)2  400
x i
 850
s 2

(x i
 X )2

4000
 1000
n 1 5 1
Por lo tanto, la media

será: Por lo tanto la desviación estándar
será:
X 
x i

850
 $170 s
(x  X)
i
2
 1000  $31.62
n 5 n 1
Concluimos que en promedio cada uno de los sueldos varían aproximadamente $31.62
respecto al sueldo promedio.
IPN 75 CECYT-18
Ejemplo: Los siguientes datos muestran el tiempo de espera para ser atendidos en dos
empresas de planes telefónicos: “Telsel” y “Movister”. Calcule las desviaciones estándar en
los tiempos de espera de cada una de las empresas.
Empresa “Telsel” Empresa “Movister”
Tiempos de espera (xi  X)2 Tiempos de espera (xi  X)2

(min) con X  7.2 (min) con X  7.2
4.1 (4.1  7.2)2  9.61 6.6 (6.6  7.2)2  0.36
5.2 4.00 6.7 0.25
5.6 2.56 6.7 0.25
6.2 1.00 6.9 0.09
6.7 0.25 7.1 0.01
7.2 0.00 7.2 0.00
7.7 0.25 7.3 0.01
7.7 0.25 7.4 0.04
8.5 1.69 7.7 0.25
9.3 4.41 7.8 0.36
11.0 14.44 7.8 0.36

__ __
n  11 n  11
 (x i  X )2  38.46  (x i  X )2  1.36
Una vez que tenemos las distancias respecto a la media al cuadrado, calculamos el valor de
la desviación estándar para los tiempos, es decir,
Empresa “Telsel” Empresa “Movister”
s
(x  X) i
2

38.46
 1.96 min s
(x  X)i
2

1.36
 0.11 min
n 1 11  1 n 1 10
Si observamos los datos, aunque ambas empresas tengan el mismo tiempo promedio de espera
(7.2 minutos), los tiempos de espera en “Telsel” tienden a estar 1.96 minutos alejados de la
media mientras que, en el “movister”, los tiempos tienden a alejarse sólo 0.11 minutos. Por
esta razón, se pueden explicar las filas en “Telsel” y mayor disgusto de los clientes por el
tiempo de espera.
IPN 76 CECYT-18
Varianza y desviación estándar para datos agrupados
Para calcular la varianza y la desviación estándar en un conjunto de datos agrupados, es decir, a

partir de una tabla de distribución de frecuencias se calcula de la siguiente manera:
Varianza de una muestra de datos agrupados s2 

(x i
 X )2  fi
n 1
Desviación estándar de una muestra es la medida de

variación de los valores respecto a la media. s
(x  X)  f
i
2
i
n 1
Donde:
s 2 es la varianza muestral X es la media de la muestra
s es la desviación estándar muestral n es el número de observaciones
xi es el valor de la marca de clase de la muestra
fi es la frecuencia absoluta
Para ilustrar el procedimiento del cálculo de la varianza y la desviación estándar analicemos la

siguiente tabla de frecuencias que nos indica el tiempo en segundos que tardan algunos clientes en
una caja bancaria.
Tiempo Número de Marca fi  xi (xi  X)2 (xi  X)2  fi

clientes de clase
(seg)
fi xi
[141-157) 2 149 298 (149- 2301.13
182.92)2=1150.57
[157-173) 13 165 2145 321.13 4174.64
[173-189) 17 181 3077 3.69 66.36
[189-205) 14 197 2758 198.25 2775.45
[205-221) 3 213 639 904.81 2714.42
[221-237) 1 229 229 2123.37 2123.37
f i
 50
f  xi i (x  X )  f
i
2
i
 9146  14155.37
IPN 77 CECYT-18
El cálculo de la media del conjunto de datos será: X 
__
(f  x )  9146  182.92
i i
f i
50
El valor de la varianza es s
2

(x  X )  f
i
2
i

14155.37
 288.88s 2
n 1 50  1
El valor de la desviación estándar es
s
(x  X)  f
i
2
i

14155.37
288.89  16.99s
n 1 50  1
Por lo tanto, los tiempos varían respecto a la media en 16.99 segundos en promedio.
IPN 78 CECYT-18
ESTANDARÍZATE 4
1. La siguiente tabla de distribución de frecuencias registra el número de horas al mes que

108 personas altruistas dedican a labores sociales. Determine la varianza y la desviación
típica o estándar.
Intervalos (Horas) Frecuencia (Miembros)
10-14 6
15-19 14
20-24 23
25-29 28
30-34 19
35-39 11
40-44 7
2. Dados los siguientes valores: 11, 3, 5, 2, 14, 9, 7, 15, 4, 6, calcula la varianza y la desviación
estándar.
3. El gerente de una empresa de alimentos desea saber qué tanto varían los pesos de los paquetes (en
gramos) de tortillas de nopal, ya que, esta información le permite determinar cuánto es el promedio
de pérdidas causado por el exceso de peso en los paquetes y le da las bases para tomar correctivos
en el proceso de empacado; para ello, selecciona una muestra al azar de paquetes para pesarlos y
registrar el peso.
541 545 543 515 513 518 515 486 489 544
498 520 536 544 527 513 497 527 495 538
a) Calcula la varianza y la desviación estándar.
a) Si el peso de los paquetes está calculado en 500gr netos, ¿considera que hay pérdida o ganancia
en cuanto a la materia prima? Utilice la estadística descriptiva (gráficos, medidas, etc.) para
argumentar.
IPN 79 CECYT-18
Medidas de forma
Las medidas de forma son indicadores que ofrecen información acerca de cómo los datos se
encuentran contenidos dentro de una distribución y se clasifican en:
Medidas de simetría o asimetría (sesgo)

Medidas de apuntamiento (curtosis)
La relación que existe entre las medidas de tendencia central y la simetría de una distribución
podemos definirla a través del sesgo y coeficiente de simetría.
Sesgo
El sesgo o asimetría es una medida que indica la simetría de la distribución de una variable
respecto a la media aritmética, sin necesidad de hacer una representación gráfica. Los
coeficientes de asimetría indican si hay el mismo número de elementos a la izquierda o a la
derecha de la media.
Asimetría negativa: la Simétrica: hay el mismo Asimetría positiva: la

cola de la distribución se número de elementos a la cola de la distribución se
alarga (a la izquierda) para izquierda y derecha de la alarga (a la derecha) para
valores inferiores a la media. media. Coinciden la media, valores superiores a la
mediana y moda. La media.
distribución se adapta a la
forma de campana de
Gauss o distribución
normal.
IPN 80 CECYT-18
Para determinar la simetría de una distribución, vamos a utilizar el Coeficiente de Fisher
Datos no agrupados Datos agrupados
1
Sf   

(xi  X )3 1
Sf   

fi  (xi  X )3
n  s3 n  s3
n es el número de datos n es el número de datos
X es la media de la muestra X es la media de la muestra
s es la desviación estándar s es la desviación estándar
xi es cada uno de los datos. xi es la marca de clase.
El coeficiente de Fisher concluye de acuerdo con lo siguiente:
Si Sf  0 significa que la distribución es simétrica.
Si Sf  0 significa que la distribución tiene sesgo positivo.
Si Sf  0 significa que la distribución tiene sesgo negativo.
Ejemplo: Calcula el sesgo para la siguiente distribución que nos representa la estatura (cm)
de algunos niños en edad preescolar. Realice el cálculo como datos no agrupados.
Calculando la media del conjunto tenemos que X

x i

1160
 82.86cm
n 14
Calculamos la desviación estándar, es decir, s

(x  X) i
2

37.71
 6.14cm
n 1 14  1
1
Calculamos el coeficiente de fisher: S f   
 (x i
 X )3  1  13.88
   0.004
n  s  14  (6.14)
3 3
Por lo tanto, como Sf  0 significa que la distribución tiene sesgo positivo con lo que, hay
más elementos a la derecha de la media.
IPN 81 CECYT-18
EJEMPLO: Los siguientes datos muestran edades de académicos en una determinada
universidad con una muestra de 720 docentes. Determinar la simetría de la distribución
calculando las medidas de tendencia central y calculando el coeficiente de Fisher.
Edad Frecuencia Marca Fi fi  xi fi  (xi  X)2 fi  (xi  X)3

fi de
clase
xi
20-24 21 22 21 462 12308.61 -297991.35
25-29 53 27 74 1431 19558.28 -375714.51
30-34 84 32 158 2688 16961.62 -241024.68
35-39 117 37 275 4329 9924.42 -91403.91 Moda
40-44 95 42 370 3990 1683.79 -7088.75 Mediana
45-49 80 47 450 3760 49.93 39.44
50-54 68 52 518 3536 2279.64 13199.11
55-59 59 57 577 3363 6869.02 74116.75
60-64 49 62 626 3038 12216.88 192904.55
65-69 40 67 666 2680 17288.96 359437.56
70-74 33 72 699 2376 21949.10 566067.17
75-79 21 77 720 1617 19908.51 612982.90
f i
 720
 f  x  f  (x  X) (x  X)
i i i i
2
i
3
 33270  140, 998.75  805, 524.28
La media del conjunto de datos tiene el valor de X 

f  x i i

33270
 46.21
f i
720
años.
La desviación estándar del conjunto de datos tiene el valor de
s
 f  (x  X)
i i
2

140,998.75
 14años
n 1 719
1  1 
 
n 
 fi  (xi  X )3 
720
  (805524.28)
Calculamos el coeficiente de Fisher S f     0.41
s3 (14)3
que es mayor que cero. Por lo tanto, como Sf  0 , la distribución tiene sesgo positivo, con
lo que, hay más datos a la derecha de la media.
IPN 82 CECYT-18
Si construimos un histograma o un diagrama de caja podemos visualizar el comportamiento
de los datos de manera gráfica.
Curtosis
La curtosis indica cuan amontonados se encuentran los datos en la zona central de una distribución;
es una medida que nos permite medir que tan achatada o puntiaguda es una distribución. Luego, las
distribuciones se clasifican en tres tipos:
1. Distribución Leptocúrtica. Es una distribución que contiene una gran concentración de

datos en la zona central y la forma de su polígono es muy puntiaguda.
2. Distribución Mesocúrtica. Es una distribución que contiene una concentración de datos

mediana en la zona central y la forma de su polígono es más chata que la leptocúrtica.
3. Distribución Platicúrtica. Es una distribución que contiene un bajo amontonamiento de

datos en su región central y la forma de su polígono es muy achatado.
IPN 83 CECYT-18
Para determinar el grado de achatamiento de una distribución se utiliza el coeficiente de
apuntamiento de Fisher:
Datos no agrupados Datos agrupados
1
Af   
(xi  X )4
3
1
Af   

fi  (xi  X )4
3
n
  s 4
n
  s 4
n es el número de datos n es el número de datos

X es la media de la muestra X es la media de la muestra
s es la desviación estándar s es la desviación estándar
xi es cada uno de los datos. xi es la marca de clase.
El coeficiente de apuntamiento de Fisher concluye de acuerdo con lo siguiente:
Si Af  0 significa que la distribución es leptocúrtica.

Si Af  0 significa que la distribución es mesocúrtica.
Si Af  0 significa que la distribución es platicúrtica.
IPN 84 CECYT-18
EJEMPLO: Hallar el coeficiente de apuntamiento de Fisher para las siguientes calificaciones,
obtenidas en un examen de Geometría analítica a un grupo de alumnos, con una escala del 1 al 10:
5 6 4 7 7 7 9 8 9 4 3
Calculamos la calificación promedio del conjunto de datos no agrupados: X

x i

69
 6.27
n 11
Calificación xi _ _
(xi  X) 2
(xi  X )4
3 (3  6.27)2  10.69 (3  6.27)4  114.33
4 5.15 26.55
4 5.15 26.55
5 1.61 2.60
6 0.07 0.01
7 0.53 0.28
7 0.53 0.28
7 0.53 0.28
8 2.99 8.96
9 7.45 55.55
9 7.45 55.55
Totales _ _
 (xi  X )2  42.18  (xi  X )4  290.95
Calculamos la desviación estándar: s 

(x  X) i
2

42.18
 2.05
n 1 11  1
El coeficiente de apuntamiento de fisher:
1
Af   
(x  X)i
4
 1  290.95
3     3  1.50
n  s  11  (2.05)
4 4
El resultado corresponde a una distribución platicúrtica, lo cual, puede interpretarse como que
probablemente contiene estudiantes promedio, algunos alumnos más aventajados y seguramente otros
tantos menos atentos
IPN 85 CECYT-18
EJEMPLO: Determina si la siguiente distribución es mesocúrtica, platicúrtica o
leptocúrtica.
EDADES DE ACADÉMICOS EN UNA DETERMINADA UNIVERSIDAD

Edad Frecuencia Marca fi  xi fi  (xi  X)4
fi de clase
xi
20-24 21 22 462 7211987.04
25-29 53 27 1431 7214470.43
30-34 84 32 2688 3423032.95
35-39 117 37 4329 841098.98
40-44 95 42 3990 29786.98
45-49 80 47 3760 31.48
50-54 68 52 3536 76528.49
55-59 59 57 3363 800312.79
60-64 49 62 3038 3047506.36
65-69 40 67 2680 7475582.82
70-74 33 72 2376 14603401.32
75-79 21 77 1617 18878647.92
f i
 720  f x
i i
 33270  f  (x
i i
 X )4  63, 602, 387.56
La media del conjunto de datos tiene el valor de X 

f x i i

33270
 46.208
n 720
años.
El coeficiente de apuntamiento de Fisher será
1  1 
 
n  f  (x  X )
i i
4
  (63,602,387.56)
720 
Af    3    3  0.700
s4 (14)4
Por lo tanto, como el coeficiente de apuntamiento

de Fisher Af  0 se trata de una distribución
platicúrtica.
IPN 86 CECYT-18
Teorema de Chebyshev
Hemos estudiado anteriormente que una desviación estándar muy pequeña para un conjunto de
valores, indica que estos valores se localizan cerca de la media; por el contrario, si un conjunto de
datos tiene una desviación estándar muy grande, indica que los datos están muy dispersos respecto
a la media.
El matemático ruso P. L. Chebyshev (1821-1894) estableció un teorema que nos permite determinar
la mínima porción de los valores que se encuentran a cierta cantidad de desviaciones
estándares de la media.
REGLA DE CHEBYSHEV. En cualquier conjunto de observaciones (muestra o población), la

proporción de valores que se encuentran a k desviaciones estándares de la media es por lo menos (o
1
más) 1  , k  1 , (Esta regla se cuple sin importar el tipo de distriución de nuestros datos).
k2
Valores de k 1.5 2 2.5 3

% de datos 55.6% 75% 84% 88.9%
Luego, pues, cuando conocemos la media y la desviación estándar de un conjunto de datos podemos
saber aproximadamente el porcentaje de valores que se encuentran alrededor de la media; para ello,
observemos el siguiente diagrama.
IPN 87 CECYT-18
EJEMPLO: Si consideramos las calificaciones del primer departamental de la materia de
probabilidad y estadística de un grupo de 50 alumnos que obtuvieron un promedio de X  70 y una
desviación estándar de s  5 , podemos cuestionarnos ¿Qué porcentaje de los estudiantes obtuvieron
calificaciones entre 60 y 80? y ¿65 y 85?
Sabemos que la media es X  70 y que s  5 , de modo que, debemos resolver la siguiente igualdad
para aproximar el valor de k.
Entonces: [X  ks , X  ks ]  [60, 80] , sustituimos nuestros valores de la media y la desviacion

estándar: [70  5k,70  5k ]  [60,80] .
Debemos resolver ambas ecuaciones para un solo valor de k. si el sistema no tiene solución, podemos
aproximarlo.
Debemos resolver [70  5k,70  5k ]  [60,80]

70  5k  60 70  5k  80
5k  60  70 5k  80  70
5k  10 10
k 2
10 5
k 2
5
NOTA: Si no encontramos un único valor de k, podemos aproximar el valor de acuerdo al valor
que estamos buscando.
Encontramos k  2 que sustituimos en la regla de Chebyshev, es decir, sustituimos

1 1
1  1  2  0.75 . Por tanto, al menos el 75% de los estudiantes obtuvieron calificaciones
k 2
(2)
entre 60 y 80.
70  65
Para las calificaciones entre 65 y 85, observemos que  1 indica que 65 está a 1 desviación
5
85  70
estándar por abajo del promedio y que  3 está a 3 desviaciones estándar por arriba de la
5
media. Luego, el intervalo que contiene al rango (65, 85) será para k  3 ; luego, aplicando la regla
1 1
de Chebyshev tenemos que 1  1  2  0.888 lo que significa que cuando menos el 88.8%
k 2
(3)
de los estudiantes deben tener calificaciones entre 65 y 85.
IPN 88 CECYT-18
EJEMPLO. Aplique el teorema de Chebyshev para el siguiente conjunto de datos agrupados.
TIEMPO NECESARIO PARA EMPACAR UN PEDIDO PARA SER

ENVIADO POR PAQUETERÍA
Tiempo No. De Marca de clase fi  xi (xi  X)2 (xi  X)2  fi
(segundos) empleados f x
i i
[30-40) 10 35 350 643.12 6431.30
[40-50) 17 45 765 235.92 4010.80
[50-60) 25 55 1375 28.72 718.24
[60-70) 32 65 2080 21.52 688.95
[70-80) 19 75 1425 214.32 4072.26
[80-90) 9 85 7656 607.12 5464.17
Total
f i
 112
f x
i i (x i
 X )2  fi
 6760  21385.72
El valor de la media está determinado por X 

f  x i i

6760
 60.36 segundos.
f i
112
El valor de la desviación estándar está determinado por:
s
(x  X)  f
i
2
i

21385.72
 13.88 segundos.
n 1 112  1
Aplicando la regla de Chevyshev, tenemos que el 55.6% de los tiempos se encuentra en el intervalo
[X  1.5s , X  1.5s ]  [60.36  1.5(13.88), 60.36  1.5(13.88)]  [39.54, 81.18] , es decir, el 55.6%
de los empleados se tardan entre 39.54 segundos y 81.18 segundos.
Aplicando la regla de Chevyshev, tenemos que el 75% de los tiempos se encuentra en el intervalo
[X  2s , X  2s ]  [60.36  2(13.88),60.36  2(13.88)]  [32.60, 88.12] , es decir, el 75% de los
empleados se tardan al menos entre 32.6 segundos y 88.12 segundos.
Aplicando la regla de Chevyshev, tenemos que el 88.9% de los tiempos se encuentra en el intervalo
[X  3s , X  3s ]  [60.36  3(13.88), 60.36  3(13.88)]  [18.72,102] , es decir, el 88.9% de los
empleados se tardan al menos entre 18.72 segundos y 90, límite superior.
IPN 89 CECYT-18
La regla empírica (Regla 68-95-99.7)
La regla empírica es el resultado de la experiencia práctica de investigadores en muchas disciplinas,

que han observado diferentes tipos de conjuntos de datos de la vida real.
Si una variable está distribuida de forma normal (forma de campana), entonces, a menos de una
desviación estándar s de la media hay aproximadamente el 68% de los datos, a menos de dos
desviaciones estándar de la media hay aproximadamente 95% de los datos y a menos de 3 desviaciones
estándar de la media hay aproximadamente 99.7% de los datos.
EJEMPLO. Una maquina embotelladora llena automáticamente embaces con bebidas de sabores.
Se sabe que la distribución de las botellas se comporta como campana (distribución normal) y que el
contenido promedio de las botellas es de 375ml con una desviación estándar de 4.3ml. Se desea saber
con más exactitud entre qué rangos de llenado están quedando las botellas de sabores.
SOLUCIÓN. El problema nos dice que el llenado tiene un comportamiento normal, de modo que
podemos aplicar la regla empírica para calcular:
(X  s, X  s )  (375  4.3,375  4.3)  (370.7,379.3)

(X  2s , X  2s)  (375  2(4.3),375  2(4.3))  (366.4,383.6)
(X  3s, X  3s )  (375  3(4.3),375  3(4.3))  (362.1,387.9)
Por lo tanto:
Aproximadamente el 68% de las botellas contienen entre 370.7ml y 379.3ml.

Aproximadamente el 95% de las botellas contienen entre 366.4ml y 383.6ml.
Aproximadamente el 99.7% de las botellas contienen entre 362.1ml y 387.9ml.
IPN 90 CECYT-18
EJEMPLO:
Determine si el conjunto de datos ordenados siguiente que representa las calificaciones de un grupo
de 50 estudiantes de Química IV tiene un comportamiento normal y de ser así, aplique el teorema
de Chevyshev o la regla empírica, según corresponda.
39 58 64 70 72 76 78 85 89 94
44 58 66 70 72 77 80 86 90 95
47 60 67 70 74 77 82 86 90 95
50 63 68 72 74 77 82 88 91 97
55 64 68 72 75 78 83 88 92 98
Encontrar el rango. Localizamos el dato menor y el dato mayor, es decir,

rango  x max  x min  98  39  59
Determinar las clases y el ancho de clase. k  1  3.33log(50)  6.6066  7 clases, de modo

rango 59
que, I    8.43
# de  clases 7
Generamos la tabla de frecuencias.
Calificaciones fi Marca fi  xi (xi  X)2 (xi  X )2  fi

(Clases) de clase
xi
[39.00 – 47.43) 3 43.21 129.63 984.08 2952.23
[47.43 – 55.86) 2 51.64 103.28 526.24 1052.49
[55.86 – 64.29) 6 60.10 360.6 209.67 1258.02
[64.29 – 72.72) 11 68.50 753.5 36.97 406.63
[72.72 – 81.15) 10 76.93 769.3 5.52 55.23
[81.15 – 89.58) 9 85.37 768.33 116.42 1047.82
[89.58 – 98.01) 9 93.80 844.2 369.41 3324.68
Total
f i
 50
f xi i (x  X )  f
i
2
i
 3728.84  10097.09
IPN 91 CECYT-18
HISTOGRAMA DIAGRAMA DE CAJA
Si analizamos el histograma y el diagrama de caja podemos observar que el conjunto de datos no

tiene un comportamiento normal (campana de Gauss) de modo que aplicamos la regla de Chebyshev
para concluir sobre las calificaciones del conjunto de 50 estudiantes.
La media para el conjunto de datos está dada por X 

f  x i i

3728.84
 74.58
f i
50
La desviación estándar está dada por s

(x  X)  f
i
2
i

10097.09
 14.35
n 1 50  1
Por lo tanto, al menos el 55.6% de las calificaciones caerán en [53.05  96.10] , es decir, al menos 28
alumnos obtienen calificación dentro del intervalo encontrado.
IPN 92 CECYT-18
ESTANDARÍZATE 5
1. En el cecyt-18 se han registrado los retardos de los trabajadores a través del checador de recursos
humanos. Se emitió un reporte que indicara lo tiempos de retardo, siendo la tolerancia de 1 a 15
minutos.
6 6 7 8 6 7 12 6 6 10 10 6 7 5 5 4 6 5 12 9 9 10 6 9 10 12 9 4 2 5 10 7 7 3 10 7 7 9 6 4 13 7 7 7 11 8
8 11 4 4 5 8 6 6 8 4 7 11 2 6 5 8 3 5 8 8 8 8 12 9 8 7 6 10 8 2 6 8 10 11 8 12 4 8 5 7 7 9 11 7 9 7 8 10
5 10 8 7 10 7
a) Calcula una tabla de frecuencias no agrupada y un histograma.
c) Obtener la media, moda, varianza y desviación estándar para el conjunto de datos.
d) Obtener la mediana, el cuartil uno y tres.
e) Encuentre los valores -1.25s y 1.25s con respecto a la media, ¿Qué porcentaje de los datos se
encuentra en este intervalo?
f) Encuentre los valores -2.75s y 2.75s con respecto a la media, ¿Qué porcentaje de los datos se
g) Encuentre los valores -3s y 3s con respecto a la media, ¿Qué porcentaje de los datos se
h) ¿En qué proporción del tiempo los trabajadores llegan con 10 minutos de retardo o más?
2. El siguiente conjunto de datos muestra las mediciones en ml de una muestra de 20 botellas de

leche deslactosada para revisar el llenado, registrando los siguientes datos:
408 358 402 424 372 370 412 389 421 424
416 336 385 410 419 367 423 330 355 379
a) Determina si la distribución es simétrica (realiza el cálculo como datos no agrupados).
b) Calcula la varianza y la desviación estándar como datos no agrupados.
c) Se desea saber qué porcentaje de botellas contienen entre 360 y 450 ml
d) La empresa rechaza la producción si excede la media más 1.5 veces la desviación estándar. Qué
porcentaje de la producción debe ser rechazado, en caso de existir.
IPN 93 CECYT-18
2. PROBABILIDAD
Teoría de conjuntos
Un conjunto es una colección de objetos. A estos objetos les llamaremos elementos del
conjunto. El símbolo “  ” denota pertenencia, es decir, si A es un conjunto y x es un
elemento de A, lo denotaremos por x  A . Se lee como: “x pertenece a A, o bien, x
es un elemento del conjunto A”
Siempre que se describen los elementos de un conjunto se encierran entre llaves, del siguiente modo:
{0,1,2,3,4,5,6,7,8,9} ( conjunto de los números del cero hasta el nueve).
PROPIEDADES:
La colección de objetos debe estar bien definida.

Ningún objeto del conjunto se debe de contar más de una vez.
El orden en que se enumeran los objetos carece de importancia.
Algunos ejemplos de conjuntos pueden ser: los alumnos de sexto semestre del CECyT-18, los
elementos enlistados de la guardia nacional, etc.
CUANTIFICADORES
Cuantificador Cuantificador Conector Conector “y” Conector “tal

“para todo”  “existe” “o”  que”
  |
Este cuantificador Este cuantificador Crea una Crea una Este conector
universal forma parte universal forma parte sentencia sentencia indica a los
de un lenguaje de un lenguaje verdadera verdadera elementos de un
formal que indica formal que indica siempre que siempre que conjunto que
“para todo”, “cada”, “existe”, “algún”, alguna de las ambas cumplen una
“para cada”, “todo”. “por lo menos uno”, dos premisas premisas se cracterística;
“basta que uno”. o ambas se cumplen. “tal que”, “tales
cumplen. (A  B ) que”.
(A  B )
IPN 94 CECYT-18
Podemos determinar un conjunto de las siguientes maneras:
Dando una lista de los objetos o Dando la condicion o las condiciones que
elementos que lo forman (por deben cumplir sus elementos (por
extensión) comprensión)
A  {0,1,2,3, 4,5,6,7,8,9} {x | p(x)} o {x : p(x )}
D  {2, 4,6,8,10,...} A  {x | x es unestado de la república mexicana}

 {Zacatecas,Guanajuato,Aguascalientes,...}
E  {negro,blanco,rojo,azul ,amarillo} B  {x | x  3, x  }  {3,4,5,6,...}
C  {x | x 2  2x  3  0}  { 3,1}
Diagramas de venn Por descripción verbal
Consiste en representar al conjunto Es un enunciado que describe la característica que es
universal mediante un rectángulo y los común para cada uno de los elementos de un
otros conjuntos mediante círculos o conjunto, por ejemplo:
cualquier otra figura.
G=“El conjunto de las letras vocales”
Subconjunto. Si todo elemento de un conjunto A es también un elemento de un

conjunto B, entonces se dice que A es un subconjunto de B y se simboliza por A  B
, es decir, A es un subconjunto de B si cada elemento que pertenece a A pertenece
también a B. Se verifica que A  B  x, x  A  x  B .
PROPIEDADES:
1. El conjunto vacío  se considera subconjunto de todo conjunto.

2. Todo conjunto es subconjunto de sí mismo, es decir, A  A
3. Si A  B , entonces hay por lo menos un elemento en A que no está en B, es decir, si
A  B  x, x  A  x  B .
4. A  B si y solo si A  B y B  A
5. Si A  B y B  C , entonces, A  C (Transitiva)
Ejemplo: Sean A  {1,2,3,4,5} y sea B  {1,3,5} , entonces, B  A , es decir, el conjunto B está

contenido en A pero, el conjunto A no está contenido en B, es decir, A  B .
Ejemplo: Si A=Conjunto de todas las aves, B= Conjunto de todos los animales con alas y C=
Conjunto de todos los animales que vuelan. Entonces, A  B , B  A , B  C , C  B .
IPN 95 CECYT-18
El conjunto universal es el conjunto que consta de todos los elementos a los que se
puede referir una situación en particular y se designa con el símbolo U .
PROPIEDADES:
1. El conjunto universal no es único; depende del problema que se estudia y puede cambiar
según la situación que se esté tratando.
2. Para un mismo problema, el conjunto universal no está definido en forma única; podemos
elegirlo a nuestra conveniencia.
Suponga, por ejemplo que:
a) U  {} , es decir, el conjunto de los número reales.

b) U  {Todos los estudiantes del Cecyt-18}
c) U  {2,4,6,8,10,12,...} números pares
De cada uno de estos conjuntos universales podemos estudiar características que sean de nuestro
interés, por ejemplo, dentro del conjunto universal de los número reales, podemos estudiar aquellos
elementos que sean solución de la ecuacion x  2x  3  0 . Del conjunto universal de todos los
2
estudiantes del Cecyt-18 podemos estudiar caracteríticas como alumnos regulares, alumnos por
semestre académico, etc.; del conjunto universal de los números pares podemos estudiar a todos
aquellos que son divisibles por 4, entre otras caracteríticas.
El conjunto vacío o nulo es aquel que no contiene o no posee elementos y se designa

con el símbolo  o por {} .
PROPIEDADES:
1. Señale que el conjunto vacío  es distinto de cero y de {0}.

a.  es un conjunto sin elementos.
b. {0} es un conjunto con un solo elemento, el número cero.
c. Cero es un número y no un conjunto
IPN 96 CECYT-18
Operaciones con conjuntos
La unión de dos conjuntos denotada por A  B  {x | x  A  x  B} . A unión B

está formado por los elementos que están en A ó están en B ó están en ambos conjuntos.
Se verifica que x, x  (A  B)  x  A  x  B . El operador “ ” significa “ó”, es
decir, elemento “x” pertenece a la unión de los conjuntos A y B si éste se encuentra en
el conjunto A ó en el conjunto B ó en ambos conjuntos.
Utilizando diagramas de Venn, la unión queda determinada como:
PROPIEDADES:
1. A    A
2. A  U  U A  (A  B)
3. A  A  A
6.  A y B
B  (A  B)
4. A  B  B  A Conmutativa
7. A  B  A  B  B
5. A  (B C )  (A  B)  C Asociativa
8. Si A  B    (A  )  (B  )
IPN 97 CECYT-18
Considere los conjuntos:
Ejemplo 1 Ejemplo 2
A  {1,3,5,7,9} A  {x | x 2  4  0}
B  {2,4,5,6,8} B  {1,3,6}
A  B  {1,2,3,4,5,6,7,8,9} A  B  {2,1,2,3,6}
Ejemplo 3
Consideremos al conjunto U  {} y sean los conjuntos A  {x   : x 2  3x  2  0} ,
B  {x   : x 3  4x } y C  {x   : 0  x  4} . Encuentre:
a. A  B
b. B  C
c. A  B  C
Además, represente al universo U y a los conjuntos en un diagrama de Venn.
Resolviendo, tenemos los conjuntos por extensión:

A  {x   : x 2  3x  2  0}  {2,1}
B  {x   : x 3  4x }  {2,0,2}
C  {x   : 0  x  4}  {0,1,2,3} .
Por lo tanto:
a. A  B  {2,1,0, 2}
b. B  C  {0,2, 2,1,3}
c. A  B  C  {2,1,0, 2,3}
Ejemplo: Dado el siguiente diagrama de Venn, calcule
a) A  B
b) B C
c) AC
A  B  {a,b,c, f , g, h, i, j }
B  C  {c, f , g, h, i, j, k, l , m}
A  C  {a,b,c, i, j, k, l , m, n}
IPN 98 CECYT-18
La intersección de dos conjuntos denotada por A  B  {x | x  A  x  B} . A
intersección B está formado por los elementos que están en A y que están en B al
mismo tiempo. Se verifica que x, x  (A  B)  x  A  x  B . El operador “  ”
significa “y”, es decir, el elemento “x” pertenece a la intersección de los conjunto A y
B si éste se encuentra en el conjunto A y en el conjunto B.
Utilizando diagramas de Venn, la intersección queda determinada como:
PROPIEDADES:
(A  B)  A
1. A     6.  A y B
(A  B)  B 
2. A U  A
7. A  B  A  B  A
3. A  A  A
A  (B C)  (A  B)  (A C)
4. A  B  B  A Conmutativa 8.
5. (A  B) C  A  (B  C ) Asociativa A  (B C)  (A  B)  (A C)
Distributivas
Ejemplo 1 Ejemplo 2
A  {1,3,5,7,9} A  {x | x 2  4  0}
B  {2,4,5,6,8} B  {1,3,6}
A  B  {5} A  B  {}
Ejemplo 3
Sean A  B  {2}
A  {1, 2, 3, 4, 5}, B  {x | x  x  6  0}  {3, 2}
2
A  C  {2, 3}
C  {x | x 3  4x 2  x  6  0}  {1, 2, 3} A  B  C  {2}
IPN 99 CECYT-18
El complemento de un conjunto A denotado por A ' , es el conjunto de los elementos
x que pertenecen al conjunto universal U pero que no pertencen a A.
Se verifica que A '  {x | x U  x  A}
Utilizando diagramas de Venn, A ' queda determinada como:
Ejemplo 1 Ejemplo 2
Sea U  {a,e, i ,o, u} , luego U  {1,2,3,4,5,6,7,8,9} , luego
Si A  {a,u} por tanto Si B  {3,4,5,6} por tanto

A '  {e, i ,o} B '  {1,2, 7, 8, 9}
Ejemplo 3
Sea U  {1,2,3,4,5,6,7,8,9,10} y los conjuntos A  {1,3,5,7} , B  {x U : 4  x  8} y

C  {x U : x  6}
Por lo tanto:
a) Si A  {1,3,5,7} , entonces, A'  {2,4,6,8,9,10}

b) Si B  {x U : 4  x  8} , entonces, B '  {1,2,3,4,8,9,10}
c) Si C  {x U : x  6} , entonces, C '  {1,2,3,4,5}
PROPIEDADES
1. A  A '  U 4.  '  U
2. A  A '   5. (A')'  A
3. U '   6. A  B  B '  A '
IPN 100 CECYT-18

Para el complemento contamos también con el siguiente resultado:
LEYES DE “DE MORGAN”

“El complemento de la unión de dos conjuntos, “El complemento de la intersección de dos
es igual, a la intersección de sus complementos” conjuntos, es igual, a la unión de sus
complementos”
(A  B)'  A' B '
(A  B)'  A' B '
Demostración
(A  B)'  A ' B ' (A  B)'  A ' B '
x, x  (A  B)'  x, x  (A  B)' 
x  (A  B)  x  (A  B) 
x A  x B  x A  x B 
x  A ' x  B '  x  A ' x  B ' 
x  A ' B ' x  A ' B '
La diferencia de dos conjuntos denotada por A  B  {x | x  A  x  B} . A menos

B está formada por los elementos de A pero que no están en B. se verifica que
x, x  (A  B)  x  A  x  B .
PROPIEDADES:
1. A  B  A B' 6. (A  B)  A
2. A  A 7. A  B  (A B)  B  A (A B)
3. AA   8. B  (A  B)  
4. A  (B  C )  (A  B)  (A  C ) 9. A  B  A  B  
5.   A  
IPN 101 CECYT-18

Ejemplo 1 Ejemplo 2
A  {1,3,5,7,9} A  {x | x 2  4  0}
B  {2,4,5,6,8} B  {1,3,6}
A  B  {1,3,7,9} A  B  {2,2}
DEMOSTRACIÓN DE LAS PROPIEDADES DE DIFERENCIA
A  B  A B' B  A  B  A'
Demostración Demostración
AB  AB 
x, x  A  x  B  x, x  B  x  A 
x A  x B'  x  B  x  A' 
x  (A  B ') x  (B  A')
DEMOSTRACIÓN DE LA PROPIEDAD A  B  A  (A  B) (iniciamos por parte derecha)
A  (A  B)  A  (A  B)' Propiedad 1 de la diferencia

 A  (A' B ') Leyes de De Morgan
 (A  A')  (A  B ') Propiedad distributiva
   (A  B ') Propiedad B  B '  
 A  B ' Propiedad  A    A
 A  B Definición de diferencia
DEMOSTRACIÓN DE LA PROPIEDAD (A  B)'  B  A' (iniciamos por parte izquierda)
(A  B)'  (A  B ')' Propiedad 1 de la diferencia

 A ' (B ')' Leyes de De Morgan
 A ' B Propiedad (B ')'  B
 B  A' Propiedad Conmutativa
IPN 102 CECYT-18

La diferencia simétrica. Dados dos conjuntos A y B de un universo U, definimos el
conjunto “diferencia simétrica de A y B”, denotado por AB , al conjunto
(A  B)  (A  B) , es decir, AB  (A  B)  (A  B) .
Ejemplo 1 Ejemplo 2
A  {1,3,5,7,9} A  {x | x 2  4  0}
B  {2,4,5,6,8} B  {1,3,6}
AB  (A  B)  (B  A) AB  (A  B)  (B  A)
 {1,2,3,4,6,7,8,9}  {2,1,2,3,6}
PROPIEDADES:
1. AB  (A  B)  (B  A) 5. A  A  
2. (AB)C  A(BC) Asociativa 6. A  (BC )  (A  B)(A  C ) Distributiva
3. AB  B A Conmutativa 7. (AB)  (BC )  (A  B C )  (A  B C )
4. A   A
DEMOSTRACIÓN DE LA PROPIEDAD AB  (A  B)  (B  A) (Tomamos lado derecho)
AB  (A  B)  (A  B) Definición de diferencia simétrica

 (A  B)  (A  B)' Propiedad 1 de la diferencia
 (A  B)  (A' B ') Leyes de De morgan
 [(A  B)  A']  [(A  B)  B '] Distributiva para la intersección
 [(A  A')  (B  A')]  [(A  B ')  (B  B ')] Distributiva
 [  (B  A')]  [(A  B ')  ] Propiedades del complemento
 (B  A')  (A  B ') Propiedades de la unión
 (B  A)  (A  B) Definición de diferencia
IPN 103 CECYT-18

 (A  B)  (B  A) Conmutativa para la unión de conjuntos
Igualdad de conjuntos. Un conjunto A es igual a un conjunto B si ambos tienen los

mismos elementos, es decir, si cada elemento que pertenece a A pertenece también a B
y si cada elemento que pertenece a B pertenece también a A. Si A es igual a B se denota
por A  B .
Ejemplo 1: Sean A  {1,2,3,4,5} y sea B  {2, 4,1,3,5} , entonces, A B, es decir,

{1,2,3,4,5}  {2, 4,1,3,5} .
Ejemplo 2: Sean C  {3, 4,3,8} y sea B  {3, 4, 4,8} , entonces, A B, es decir,
{3,4,3,8}  {3,4,4,8} . Advierta que un conjunto no cambia si se repiten sus elementos.
Ejemplo 3: Sean A  {x | x 2  7x  12} , B  {3,4} , C  {4,3, 4,3} , entonces, A  B  C .
Leyes del álgebra de conjuntos
Acontinuación mostramos algunas leyes del álgebra de conjuntos:
IDEMPOTENCIA CONMUTATIVA
AA  A A B  B A
AA  A A B  B A
ASOCIATIVA DISTRIBUTIVAS
(A  B )  C  A  (B  C ) A  (B  C )  (A  B )  (A C )
(A  B )  C  A  (B  C ) A  (B  C )  (A  B )  (A C )
DE “DE MORGAN” DE LA DIFERENCIA SIMÉTRICA

(A  B )'  A ' B ' AB  (A  B )  (B  A)
(A  B )'  A ' B ' AB  (A  B )  (B  A)
DEL COMPLEMENTO DE ABSORCIÓN
A  A' U A  (A  B )  A
A  A'   A  (A  B )  A
(A ')'  A A  (A ' B )  A  B
U' A  (A ' B )  A  B
IPN 104 CECYT-18

' U
Aplicaremos las leyes del algebra para los siguientes ejemplos:
Ejemplo. Simplifica la expresión (A  B  C )' haciendo uso del álgebra de conjuntos.
(A  B  C )'  (A  (B  C ))' Asociamos dos términos.

 A ' (B  C )' Leyes de “De Morgan”
 A ' (B ' C ') Leyes de “De Morgan”
A ' B ' C ' Asociativas
Ejemplo. Comprueba que (A  B )  (A  C )  A  (B  C ) haciendo uso del álgebra de

conjuntos.
(A  B )  (A  C )  Partimos del lado izquierdo
 (A  B ')  (A  C ) Diferencia de conjuntos A  B  A  B '

 (A  B ')  (A  C ') Diferencia de conjuntos A  B  A  B '
 (A  A)  (B ' C ') Asociativas
 A  (B ' C ') Idempotencia
 A  (B  C )' De “De Morgan”
 A  (B  C ) Diferencia de conjuntos A  B  A  B '
Ejemplo. ¿Se cumple la siguiente igualdad (A  B )  (A  B)  A ?
(A  B )  (A  B )  Partimos del lado izquierdo
 (A  B )  (A  B ') Diferencia de conjuntos A  B  A  B '

 A  (B  B ') Leyes distributivas
A Leyes del complemento
A Propiedades de la unión
IPN 105 CECYT-18

Por lo tanto, sí se cumple la igualdad.
ESTANDARÍZATE 6
1.- Escribe los siguientes enunciados en notación de conjuntos por compresión:
1. A es el conjunto de todos los números reales 2. B es el conjunto de todos los números reales
mayores que 32 mayores que 8 pero menores que 71
3. C es el conjunto de los x tales que x al 4. D es el conjunto de los x tales que x es una

cuadrado es igual a nueve. vocal de la palabra politécnico.
2.- ¿Cuáles de los siguientes conjuntos son finitos e infinitos?
1. Los días de la semana 2. A  {x | x es impar}
3. {2, 4,6,8,10,12,...,1000} 4. Las personas que viven en el planeta tierra.
3.- ¿Cuáles de los siguientes conjuntos son iguales?
1. A  {x | x es una letra de la palabra laboratorista} 2. Las letras de la palabra “sistemas”
3. A  {x | x es una letra de la palabra "barato "} 4. Las letras l, a, t, r, i, s
CONCLUSION: (puedes escribir los conjuntos por extensión para concluir)
4.- Dado A  {a,b,c} , ¿Cuántos subconjuntos hay en A y cuales son?
IPN 106 CECYT-18

5.- Dados los siguientes conjuntos, decir qué conjuntos son subconjuntos de los otros.
M  {x | x es un cuadrilátero}
N  {x | x es un rectángulo}
O  {x | x es un rombo}
P  {x | x es un cuadrado}
6.- Dados los conjuntos A  {4,6, 8} , B  {9, 4,8} , C  {6,4,8} y D  {4,6} , ¿Cuáles de las
siguientes afirmaciones son verdaderas?
A B 6B {3,4}  C
7B D A D  
5B B A  
7.- En cada uno de los diagramas que siguen señala o colorea A  B :
8.- En cada uno de los diagramas que siguen señala o colorea A  B :
9.- Para los siguientes conjuntos calcula lo que se te pide
A  {4,5,6,7} , B  {5,7,9,11} , C  {6,7,8,9}

AB  AB  AB 
A C  A C  C A 
B C  B C  B A 
IPN 107 CECYT-18

B B  B B  B B 
10.- Dados los conjuntos U  {m, n,o, p,q} , A  {m, n, p} y B  {n, p, q} . Calcula
AB  A B' 
B A  A ' B 
B' (AB )' 
B A  A ' B ' 
A ' B  B ' A ' 
11.- Para los siguientes diagramas de Venn, señalar lo que se indica.
(A  B)' (B  A)'
A  (B C ) (A  B)  (A  C )
A  (B C ) (A  B)  (A  C )
IPN 108 CECYT-18

12.- Considere el conjunto universal U  {} , encuentre los conjuntos que definen las siguientes
condiciones:
A  {x | (x 2  8x  15)(x  1)  0} Sol.
B  {x | x 2  8x  15  0} Sol.
C  {x | x 2  2} Sol.
13.- Considere el conjunto universal U  {}  {..., 2, 1,0,1,2,...} , encuentre los conjuntos que
definen las siguientes condiciones:
A  {x | (x 2  8x  15)(x  1)  0} Sol.
B  {x | x 2  8x  15  0} Sol.
C  {x | x 2  2} Sol.
14.- El siguiente conjunto dado por ¿?  {2,3,4,5,6,9,16,25,36} y considerando a

R  {4,9,16, 25,36} y al conjunto S  {2,3, 4,5,6} . ¿Cuál de las siguientes expresiones lo representa?
b. S  R
c
a. R  S c. R  S d. S  R
IPN 109 CECYT-18

15.- Representa con diagramas de venn cada uno de los incisos del problema anterior de acuerdo
con los conjuntos dados y considerando que U  {2,3, 4,5,6,9,16,25,36}
b. S  R
'
a. R  S c. R  S d. S  R
16.- Sean A, B y C tres conjuntos cualesquiera. Demuestre que A  B  (AB)  B .
17.- Sean A, B y C subconjuntos del universo U. Demostrar que A  (AB)  A  B .
18.- Demuestre que (A  B)  (A  B ')'  B
19.- Demuestre que (A  B)  C  (A  C )  (B  C )
20.- Demuestre que (A  B)' (A ' B)  A '
IPN 110 CECYT-18

 
c
21.- ¿Cuál es el resultado de simplificar la expresión (A B)  B  (A B)  C ? Utiliza las
leyes del álgebra.
a. A
c
b. U c. (A  B )c d. B
c
e. (AB)c
La cardinalidad de un conjunto es la que indica el número o la cantidad de elementos

que tiene un conjunto y se denota por N(A) .
Si consideramos, por ejemplo, el conjunto con los elementos A  {a,e, i,o, u} , analicemos que tiene 5
elementos, de modo que la cardinalidad del conjunto es N(A)  5 ya que está formado por 5
elementos.
Si consideramos el conjunto dado por B  {} , entonces, la cardinalidad del conjunto será N(B)  0
Ahora veamos que si C  {x | x  ,0  x  2} , entones, la cardinalidad del conjunto será N (C )  1
Sea A  {x | x es una vocal de la palabra "politecnico "} , ¿Cuál es su cardinalidad? N(A)  3
Sean: Calcular:
A  {1,2,3,4,5} N (A)  5
B  {2,4,6,8,10} N (B )  5
N (A  B )  3
N (AB )  6
Sea A un conjunto, definimos el conjunto potencia de A, al conjunto formado por

todos los subconjuntos del conjunto A y se representa por P(A) y su cardinalidad se
denota por N (P (A))  2N (A) .
IPN 111 CECYT-18

Luego, el conjunto potencia de un conjunto, es otro conjunto formado por los subconjuntos
del conjunto, o bien, dado un conjunto A, su conjunto potencia es el conjunto formado por
todos los subconjuntos posibles de A y su símbolo es P(A) .
Si consideramos, por ejemplo, al conjunto A  {1,2,3} , calculamos su conjunto potencia

calculando primeramente su cardinalidad, entonces, N (A)  3 y entonces su cardinalidad
será N (P (A))  23  8 .
Si mostramos los elementos del conjunto potencia o bien, todos los subconjuntos del conjunto
dado, estos son P(A)  {,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}} .
CARDINALIDAD DE CONJUNTOS POR DIAGRAMAS DE VENN
Es posible determinar la cardinalidad de cualquier conjunto de elementos u objetos los cuales sean
contables mediante operaciones de cardinalidad.
Por ejemplo, considere lo siguiente:
Ejemplo: En el grupo 5IM7 de la carrera de químico laboratorista de cecy-t 18, hay 45 alumnos, a
20 alumnos les gusta la materia de cálculo diferencial, a 30 les gusta la materia de probabilidad y
estadística y a 10 les gustan ambas asignaturas. Determine (C  P)' .
Para resolver el problema debemos definir los siguientes conjuntos:
 U  {x : x es un estudiante del grupo 5IM7}

 C  {x : x es un estudiante que le gusta cálculo}
 P  {x : x es un estudiante que le gusta probabilidad y estadística}
Luego, definimos las cardinalidades:
 N(C  P)  10 “estudiantes que les

N (U )  45 gusta cálculo y probabilidad”
N (C )  20  N(C  P)  10 “estudiantes que les

N (P )  30 gusta cálculo pero no la probabilidad”
N (C  P )  10  N(P  C )  20 “estudiantes que les
gusta la probabilidad pero no el
cálculo”
IPN 112 CECYT-18

Definimos que N (A  B)  N (A)  N(B)  N (A  B) , es decir, la cardinalidad de la unión es igual a
la cardinalidad del conjunto A, más la cardinaliad del conjunto B y hay que quitar la cardinalidad
de los elementos comunes si esque los ubiera, ya que, los estariamos duplicando. Entonces,
N (C  P )  N (C )  N (P )  N (C  P )
 20  30  10
 40
Luego, sabemos que N(C  P)'  5 . Que si graficamos los

resultados con un diagrama de Venn, tenemos que:
Considere las siguientes reglas para el cálculo de cardinalidad de conjuntos:
N (A  B)  N (A)  N(B)  N (A  B)
N(A  B C )  N(A)  N (B)  N(C )  N (A  B)  N(B  C )  N(C  A)  N (A  B  C )
N(A  B)  N(A  B)  N(A  B)  N (B  A)
N (A)  N (A  B)  N (A  B)
Analicemos el siguiente ejemplo:
Ejemplo: De los alumnos de sexto semestre, los cuales son 65, a 40 de ellos les gusta dibujo técnico,
a 30 les gusta geometría analítica y a 10 de ellos les gustan ambas materias. Responda:
a) A ¿Cuántos alumnos les gusta al menos una de las

dos materias?
b) A ¿Cuántos les gusta solamente geometría y
trigonometría?
c) A ¿Cuántos les gusta exactamente una de las dos
materias?
d) A ¿Cuántos estudiantes no les gusta ninugna de las
dos materias?
Para resolver el problema debemos definir los siguientes conjuntos:
U  {x : x es un alumno de sexto semestre}

D  {x : x es un estudiante que le gusta dibujo técnico}
G  {x : x es un estudiante que le gusta geometría y trigonometría}
IPN 113 CECYT-18

Entonces, de acuerdo con el enunciado y el diagrama de Venn que hemos construido tenemos que
N(U )  65 , N (D)  40 , N(G)  30 , N(G  D)  10 , N (G  D)  20 , N (D  G)  30 ,
N(G  D)  60 y N(G  D)'  5 .
a. A los alumnos que les gusta al menos una materia deben pertenecer a la union de los
conjuntos, es decir, N(G  D)  60 alumnos.
b. A los alumnos que les gusta únicamente la geometría y trigonometría deben pertenecer a la
diferencia N (G  D)  20 alumnos.
c. A los alumnos que les gusta únicamente una de las dos materias deben estar en la diferencia
simétrica, es decir, N (GD)  N (G  D)  N(D  G)  20  30  50 alumnos.
d. A los alumnos que no les gusta ninguna de las dos materias deben estar en el complemento
de la union de G y D, es decir, N(G  D)'  5 alumnos.
Ejemplo: En la carrera de técnico en sistemas se realizó una encuesta a 200 estudiantes para saber
qué lenguaje de programación preferían aprender al inicio del semestre, se encontró que:
50 estudiantes prefieren lenguaje C, 65 estudiantes prefieren C++, 77 estudiantes prefieren Java, 100
estudiantes prefieren C o C++, 105 estudiantes prefieren C++ o Java, 110 estudiantes prefieren C
o Java, 10 estudiantes prefieren C y Java pero no C++.
Determine la cardinalidad de (C C    J ) , es decir, los estudiantes que prefieren estudiar los tres
lenguajes de programación y la cantidad de esudiantes que si les gusta C y C++ pero no Java;
además, determine N(C    J ') , N(C 'C    J ') y N ((C  C  )  J ')
N (C  J )  N (C )  N (J )  N (C  J )
110  50  77  N (C  J )
N (C  J )  17
N (C    J )  N (C  )  N (J )  N (C    J )
105  65  77  N (C    J )
N (C    J )  37
N (C  C  )  N (C )  N (C )  N (C  C  )
100  50  65  N (C    J )
N (C    J )  15
IPN 114 CECYT-18

Una vez que hemos calculado cada una de las cardinalidades podemos ir completando el diagrama
de Venn hasta obtener las cardinalidades en su totalidad y encontrar que N (C C    J )  7 ,
N((C C  )  J )  8 , N (C    J ')  28 , N(C 'C    J ')  20 y N ((C C  )  J ')  53 .
Para crearnos una idea de lo que estamos haciendo, lo hacemos a través del siguiente diagrama de
Venn:
ESTANDARÍZATE 7
1.- Determine el porcentaje de alumnos que practican futbol y basquetbol si al entrevistar a 1000
estudiantes se obtuvieron las siguientes respuestas: 500 estudiantes practican futbol, 600 estudiantes
practican basquetbol y 150 estudiantes no practican ni futbol ni basquetbol.
2.- De un grupo de 100 alumnos, 51 no llevan el curso de aritmética, 47 no llevan álgebra y 73 no

llevan álgebra ni aritmética. ¿Cuántos alumnos llevan solo uno de los cursos? Genera un diagrama
de Venn que lo ilustre.
3.- Se realizó una encuesta a 150 personas para conocer cuál es su flor favorita, obteniéndose los
siguientes resultados: 40 personas prefieren las rosas, 55 prefieren los claveles, 67 prefieren las
geranios, 80 prefieren las rosas o los claveles, 95 prefieren los claveles o los geranios, 90 prefieren ls
rosas o los geranios y 10 prefieren las rosas y los geranios pero no los claveles. Construye un diagrama
de Venn y responde lo siguiente:
a. ¿Cuántas personas no prefieren ningun tipo de flores?

b. ¿Cuántas personas prefieren los claveles y los geranios pero no las rosas?
c. A ¿Cuántas personas les gustan las flores?
IPN 115 CECYT-18

4.- Una encuesta realizada a 200 personas acerca de su sabor preferido de helado: fresa, chocolate y
vainilla, muestra los siguientes resultados: 90 personas prefieren sabor vainilla, 80 personas no
consumen sabor fresa, 155 personas no prefieren ni fresa ni chocolate, 182 personas prefieren al
menos uno de los tres sabores, 60 personas prefieren fresa y vainilla, 15 personas consumen los tres
sabores, 105 personas no consumen chocolate.
a)¿Cuántas personas consumen solamente chocolate?
b) ¿Cuántas personas consumen fresa y chocolate?
c) ¿Cuántas personas consumen solamente sabor fresa?
d) ¿Cuántas personas consumen vainilla y chocolate pero no fresa?
e) ¿Cuántas personas prefieren al menos 2 sabores?
5.- Un estudio desarrollado con 30 personas sobre su preferencia por una mascota, arroja los siguientes
datos: 16 personas prefieren los perros, 12 prefieren los gatos y 7 prefieren los peces. Además, 5
personas prefieren los perros y los gatos, 3 prefieren los perros y los peces, 2 prefieren los gatos y los
peces y 2 personas prefieren las tres mascotas.
a) Construye un diagrama de Venn para este escenario.
b) ¿Cuántas personas prefieren los perros o los gatos pero no los peces?
c) ¿Cuántas personas prefieren los gatos y los peces pero no los perros?
d) ¿Cuántas personas prefieren sólo los peces?
6.- Un estudio desarrollado con personas sobre su preferencia en plataformas de streaming ha

mostrado los siguientes resultados: 1200 personas prefieren ver Neflex, 800 personas prefieren ver
HVO, 1100 personas prefieren ver Praim; 1500 personas prefieren Neflex o HVO, 350 presonas
prefieren Prime y HVO, 600 personas prefieren ver Neflex y Praim pero no HVO, 300 personas les
gusta ver las tres plataformas de streaming y 250 personas prefieren ver otras plataformas o television
abierta.
a) ¿Cuántos clientes prefieren ver HVO y Praim pero no Neflex?
b) ¿Cuántas personas participaron en el estudio?
c) ¿Cuántos clientes prefieren usar solamente dos plataformas?
IPN 116 CECYT-18

d) ¿Cuántas personas utilizan solamente una plataforma?
7.- Dado el conjunto universal U y los subconjuntos A, B y C; hallar N (C ) y N ((A  B)  C ) si se

tienen los siguientes datos. Representa además
con un diagrama de Venn.
N (U )  44 N(B C )  12
N(A C )  14 N[(A  B C )']  6
N(A  B C )  5 N (B)  17
N (A)  21 N (A  B  C ')  3
Técnicas de conteo
En muchas situaciones de la vida y de las matemáticas, sobre todo en la probabilidad, nos

encontramos con el problema de agrupar elementos de cierto conjunto, de acuerdo con un criterio
establecido. Al estudio de estos procesos se le denomina “análisis combinatorio” o “técnicas de
conteo”.
Las técnicas de conteo o análisis combinatorio nos permiten saber cuál es el

número de eventos posibles al realizar un experimento en el que se tienen que
contabilizar los posibles resultados.
Algunos ejemplos donde podemos utilizar las técnicas de conteo son:
Lanzar 5 monedas al aire, y preguntarnos, ¿de cuántas maneras podemos obtener un

resultado?
Tener las letras que forman la palabra “politécnico”, ¿Cuántas cadenas de 3 letras podemos
formar?
Suponga que queremos ir de un lugar A a un lugar C pasando por un punto intermedio B y,
considere que para ir de A a B tenemos 3 formas distintas y para ir de B a C tenemos 5
formas distintas de llegar, ¿Cuántas formas diferentes hay para ir de A hasta C?
IPN 117 CECYT-18

Para introducirnos al estudio de las técnicas de conteo, analicemos la siguiente definición:
El principio de la suma. Si un suceso tiene formas alternativas de llevarse a cabo,

donde la primera de esas alternativas puede realizarse de M maneras, la segunda
alternativa puede desarrollarse de N maneras y así sucesivamente, hasta la última que
puede ser realizada de W maneras, entonces el número total de maneras en que ocurre
este suceso es de M  N  W
Para ilustrar la definicion considere los siguientes ejemplos:
En la carrera de Químico Laboratorista, se imparten 3 cursos distintos Biología, 3

cursos distintos de Matemáticas y 2 cursos distintos de Estadística. ¿de cuantas maneras distintas
puede un estudiante tomar una de las materias?
Consideremos que un estudiante puede tomar la materia de 3  3  2  8 formas distintas.
Un medicamento para la diabetes se vende en 2 farmacias de Zacatecas y en tres

farmacias Jerez. Si se puede conseguir el medicamento en todas las farmacias, ¿De cuántas maneras
se puede comprar el medicamento para la diabetes?
Consideremos que una persona puede conseguir el medicamento de 2  3  5 formas.
El principio del producto. Si tenemos k eventos, donde el primero de ellos puede

ocurrir de n1 maneras, el segundo inmediatamente despues del primero de n2 maneras
y así sucesivamente hasta el k-ésimo evento, el cual, se puede realizar de nm maneras,
entonces, los k eventos se pueden realizar de n1  n 2  n 3    nm maneras.

k eventos
Se lanzan 3 monedas al aire, ¿De cuántas formas diferentes pueden caer una vez
lanzadas?
IPN 118 CECYT-18

Consideremos, primeramente, que lanzamos la primera moneda, entonces, podemos obtener sello o
águila, dos posibles resultados. Si lanzamos la segunda moneda, inmediatamente después de la
primera, tenemos dos posibilidades, para el caso en que la primera fue sello, dos posibilidades, sello
o águila, y dos posibilidades para el caso en el que obtuvimos águila en el primer caso, sello o águila
en el segundo caso y así sucesivamente para el caso de la tercera moneda. Ilustramos lo anterior con
un diagrama de árbol:
Sello
Sello
Águila
Sello
Sello
Águila
Águila
Sello
Sello
Águila
Águila
Sello
Águila
Águila
Por lo tanto, tenemos 2  2  2  8 posibiles resultados, que si los colocamos en una tabla, tendriamos:
SSS SAS ASS AAS

SSA SAA ASA AAA
Jacobo desea ir a visitar a sus padres a la ciudad de “Río grande” este fin de semana
y, para ello, debe cruzar dos ciudades: Calera y fresnillo, para llegar finalmente a su ciudad natal.
Para ir de calera a fresnillo, Jacobo tiene tres caminos para llegar y, posteriormente para llegar a
Río grande, cuenta con cuatro ; entonces, ¿De cuántas formas distintas puede llegar Jacobo a la
ciudad de Río grande?
Analicemos las posibilidades a través de un diagrama como el siguiente.
Calera Fresnillo Río grande
Consideremos pues, que, de la ciudad de calera a fresnillo, se tienen tres posibilidades y, una vez
que Jacobo ha llegado a fresnillo, cuenta con cuatro opciones para llegar a Río grande; así, tendrá
3  4  12 posibilidades para llegar a Río grande.
IPN 119 CECYT-18

Los alumnos de sexto semestre del Cecyt-18 solicitan a la florería “Víctor” un arreglo
floral con varios colores distintos para su próxima graduación. Víctor les comenta que un arreglo
floral se pude hacer con tres colores distintos a escoger; para ello cuenta con tres colores distintos de
rosas, tres colores distintos de margaritas y dos colores distintos de gladiolas. ¿Cuántos arreglos
florales distintos puede ofrecerles Víctor para escoger? Considere un arreglo con sólo un tipo de flor
de cada tipo.
Calculamos la cantidad de arreglos florales que la florería “Víctor” puede ofrecer a través de un
diagrama de árbol:
R1 R2 R3
M1 M2 M3 M1 M2 M3 M1 M2 M3
G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2 G1 G2
Luego, la florería Víctor, ofrecerá a los estudiantes 3  3  2  18 posibles arreglos florales a escoger.
El grupo 6IM1 está formado por 23 hombres y 16 mujeres, ¿De cuántas formas puede
elegirse un jefe de grupo y un sub-jefe de grupo?
Consideremos entonces que, para la elección del jefe de grupo y sub-jefe de grupo no se especifica si
puede ser la misma persona, entonces, consideraremos los dos casos.
CASO 1: (El jefe de grupo y el sub-jefe de grupo pueden ser la misma persona) Hay 37 posibilidades
distintas para ocupar el puesto de jefe de grupo y 37 posibilidades para ocupar el puesto de sub-jefe
de grupo; entonces tenemos 37  37  1369 formas de elegir a los respresentantes del grupo.
CASO 2: (El jefe de grupo y el sub-jefe de grupo NO pueden ser la misma persona) el jefe de grupo
se elegirá de entre las 37 posibilidades que hay en el grupo y posteriormente, el sub-jefe de grupo se
elegira de entre 36 posibilidades, de modo que, hay 37  36  1332 posibilidades de elegir a los
representanes del grupo.
¿Cuántos números pares mayores o iguales a 1000 de 4 cifras significativas hay?
Consideremos entonces que un número par de cuatro cifras significativas cumple las siguientes
condiciones:
IPN 120 CECYT-18

1. La cifra de las milésimas debe ser 1,2,3,4,5,6,7,8,9 y excluimos el cero ya que no sería un
número de 4 cifras.
2. La cifra de las centenas debe ser un número entre 0 y 9.
3. La cifra de las decimas debe ser un número entre 0 y 9.
4. La cifra de las unidades es un número par ( 0,2,4,6,8).
Luego, por el principio del producto tenemos que se pueden formar 10  10  10  5  5000 números
páres de cuatro cifras mayores o iguales a 1000.
Un diagrama de árbol es una forma sencilla de encontrar todos los arreglos de un

evento cuando utilizamos la regla del producto.
ESTANDARÍZATE 8
1. Se lanzan al aire tres dados, ¿De cuántas 2. Un restaurante ofrece 6 sopas, 8 guisados y 3
maneras diferentes pueden caer? postres, todos distintos. ¿Cuántos menús
diferentes podemos tener si debe tener solo un
elemento de cada tipo?
3. Las placas en Zacatecas constan de 3 letras, 4. Vuelos “Osornio”, tiene programados 7 vuelos
3 números y 1 letra, en ese orden, ¿Cuántas diarios de la ciudad de Zacatecas a México y
placas distintas se pueden hacer? Considere el cinco vuelos de México a Cancún, ¿Cuántas
Abecedario de 26 letras para cada sección de la opciones de vuelo distintas ofrece la aerolínea
placa y los números del 0-9. Sólo las letras se para viajar de Zacatecas a Cancún?
pueden repetir.
5. Un taxista tiene que ir de un punto A de una 6. En el siguiente diagrama, los puntos A, B, C,

ciudad a un punto B. Para ir de A hasta B el …, representan intersecciones entre calles y las
taxista tomará las calles horizontales siempre flechas, sentidos de tránsito permitidos, es decir,
en el sentido izquierda-derecha y las calles para ir de A hasta B hay 3 posibles caminos. ¿De
verticales siempre en el sentido arriba-abajo, es cuántas formas se puede ir del punto A al punto
decir, nunca retrocede, ¿De cuántas formas F?
IPN 121 CECYT-18

puede el taxista realizar el trayecto?
Sugerencia. Utiliza un diagrama de árbol.
7. Determinar la cantidad de números de dos 8. En la sala de juntas del cecyt-18 habrá una
dígitos que se pueden obtener, si se permite la junta con los encargados de proyecto aula. La
repetición, con los números 5, 6, 7, 8, 9. mesa central tiene forma de U. En esta reunión
estarán 6 hombres y 4 mujeres. Determinar de
cuantas formas se pueden acomodar en la sala.
9. Un estudiante de Sistemas estudia 10.- Calcule cuantos ordenamientos se pueden

diariamente lenguajes de programación y hacer con 5 cartas de póker.
códigos computacionales. Al ir a la biblioteca,
encuentra que hay 3 libros de programación y
2 libros de códigos computacionales todos de
distinto autor. Construya un diagrama de árbol
para ilustrar de cuántas maneras el estudiante
puede escoger los libros para estudiar.
Para introducirnos al siguiente apartado, analicemos la siguiente situación:
considere los siguientes enunciados:
A. ¿De cuántas formas se puede ordenar el número 1?

B. ¿De cuántas formas se pueden ordenar los números 1, 2?
C. ¿De cuántas formas se pueden ordenar los números 1, 2, 3?
D. ¿De cuántas formas se pueden ordenar los números 1, 2, 3, 4?
Para el A) tenemos que la única forma de ordenar al número 1 es una sola vez (una forma).
Para el B) tenemos que las formas de ordenar a los números 1 y 2 son: 12, 21 (dos formas).
Para el C) tenemos que las formas de ordenar a los números 1, 2 y 3 son: 3  2  1  6 formas.
2 3
1
3 2
1 3
2
3 1
1 2
3
2 1
IPN 122 CECYT-18

Para el caso D) tenemos que las formas de ordenar 3 4
2
a los números 1, 2, 3 y 4 son: 4  3  2  1  24
4 3
2 4
1 3
formas. 4 2
2 3
4
3 2
3 4
1
4 3
1 4
2 3
4 1
1 3
4
3 1
4 2
1
2 4
1 4
3 2
4 1
1 2
4
2 1
2 3
1
3 2
1 3
4 2
3 1
1 2
3
2 1
De esta forma podemos observar que, si tuviéramos cinco números, tendríamos 5  4  3  2  1  120
formas distintas de ordenarlos. Definimos de esta forma a ésta operación como el factorial de un
número.
El Factorial de un número entero positivo se define como el producto que se obtiene

de multiplicar los números enteros desde 1 hasta el número n indicado, de modo que,
el factorial de un número está dado por:
1  2  3    (n  1)  n si n0
n!  
 1 si n0
(n  1)!  (n  1)  n !; para n  0 tenemos que

Considere por la definición que,
(0  1)!  (0  1)  0!  1!  1  0!  1  0!
Algunos ejemplos del uso del factorial de un número pueden ser los siguientes:
IPN 123 CECYT-18

1. 1 !  1 9! 9! 3 !(4)(5)(6)(7)(8)(9)
 
2. 2 !  1  2  2 3 !(7  4)! 3 !(3 !) 3 !3!
3. 3 !  1  2  3  6 5.
 4!
(4)(5)(6)(7)(8)(9)
5 ! 1  2  3  4  5 (4 !)(5)   10080
4.   5 (1)(2)(3)
4! 1
234 (4 !)
4!
Dos técnicas de conteo que se consideran importantes son:
Las combinaciones (no importa el orden en los elementos)

Las permutaciones (importa el orden en los elementos)
Para diferenciar cada una de las técnicas anteriores, consideremos el siguiente:
Calcular las permutaciones y las combinaciones que se pueden obtener con las tres
letras ABC.
PERMUTACIONES COMBINACIONES
ABC ABC
ACB
BAC
BCA
CBA
CAB
Observe en este caso que, cada permutación de las letras ABC es distinta, es decir, cada palabra
formada al permutar las letras ABC es diferente.
Además, en el caso de las combinaciones, el orden no importa y por ello se tiene sólo un resultado.
Los resultados ABC, ACB, BAC, BCA, CBA, CAB son iguales cuando se habla de combinaciones
y son diferentes cuando se habla de permutaciones.
Combinaciones
Una Combinación son todos los agrupamientos que se pueden hacer con n
elementos de un conjunto, tomando r de ellos a la vez y teniendo en cuenta que
r  n . Se determina por
n!
Crn  “Combinaciones de n en r”
r !(n  r )!
Observe que la combinación de n objetos tomados r a la vez de un conjunto A, es

cualquier
IPN
elección de elementos, donde el orden
124
no importa. CECYT-18
Nota. Una analogía para combinar es “formar un compuesto” o “hacer equipos”.

En una bolsa se tienen 2 canicas blancas, 2 canicas negras y una canica azul. Se
extraerán 2 canicas al azar de forma simultánea, ¿De cuántas formas se pueden extraer? tenga en
cuenta que para las combinaciones consideramos a todas las canicas como elementos diferentes, es
decir, distingue entre cada una de las negras y cada una de las blancas.
Analice que en la bolsa se tienen un número total de 5 canicas de las cuales no nos importa el orden
en que se saquen, por tanto, se tienen 5 elementos y se requiere sacar dos de ellos.
n! 5!
Aplicando nuestro resultado anterior, tenemos que hay C rn    10 formas.
r !(n - r )! 2 !(5 - 2)!
Si ilustramos estos resultados utilizando un diagrma de árbol veamos la siguiente situacion:
N2 N1 N1 N1 N1
B1 B1 N2 N2 N2
N1 N2 B1 B2 A
B2 B2 B2 B1 B1
A A A A B2
4 posibilidades 3 posibilidades 2 posibilidades ya 1 posibilidad ya 0 posibilidades

ya que: que: que:
N1-B2=B2-N1
N1-N2=N2-N1 N1-B1=B1-N1 N2-B2=B2-N2
N2-B1=B1-N2 B1-B2=B2-B1
Para una conferencia sobre máximos y mínimos de una función se seleccionan 3

expositores de un grupo de tres expertos en Cálculo integral y 2 expertos en cálculo diferencial. ¿De
cuántas maneras se pueden escoger 2 expertos en cálculo integral y uno en cálculo diferencial para
formar el equipo de tres expositores?
Si construimos un diagrama de árbol para ilustrar la situación, será el siguiente:
IPN 125 CECYT-18

D1
I2
D2
I1 Observe que, para la selección de los dos expertos en
D1
I3 cálculo integral tenemos sólo tres formas de elegirlos ya
D2
D1 que, como hablamos de combinar, la permutación
I1 (X)
D2
I2 I1-I2= I2-I1, de igual forma I3-I1=I1-I3 e I3-I2=I2=I3
D1
I3
D2
Considerando pues, las ramas 3 ramas para elegir a los
D1
I1 (X) expertos en cálculo integral tomamos las opciones para
D2
I3 elegir a los expertos en cálculo diferencial que serían 2.
D1
I2 (X)
D2
Para dictar la conferencia se tiene un total de 5 especialistas y se requiere sacar 3 de ellos, de los
cuales, 2 deben ser expertos en integral y uno en diferencial. Entonces, para el primer caso tendremos
un total de 3 elementos y se requieren 2 de ellos y un segundo caso, tenemos un total de 2 elementos
n! 3!
y se requiere 1 de ellos, entonces, C 23    3 formas de elegirlos y para cada una
r !(n - r )! 2 !(3  2)!
n! 2!
de ellas tenemos ahora C 12    2 . Por lo tanto para elegir a los conferencistas,
r !(n - r )! 1!(2  1)!
tenemos 3  2  6 formas distintas de elegirlos.
En la clase de probabilidad y estadística con 28 estudiantes del grupo 6IM1 se van a

entregar 4 premios iguales a los mejores promedios sin importar el orden. Calcule de cuántas maneras
se pueden entregar los premios si un estudiante no puede recibir más de un premio.
En el grupo 6IM1 hay 28 estudiantes y se van a entregar 4 premios a los mejores promedios sin
importar el orden; por lo tanto, podemos aplicar la fórmula de combinaciones sin repetición, es decir,
n! 28 !
tenemos que los premios se pueden repartir de C 428    20, 475 formas
r !(n - r )! 4 !(28  4)!
distintas.
Permutaciones
Una Permutación es una ordenación o arreglo diferente con un conjunto de n

elementos tomados todos a la vez quedando determinada por:
Pn n  n Pn  n ! “combinando todos los elementos”

IPN 126 CECYT-18
Una permutación de n elementos distintos tomados r a la vez con r  n , está dada
por:
Si deseamos encontrar la cantidad de permutaciones que podemos encontrar con n objetos usando
todos a la vez la podemos encontrar haciendo uso de la expresión Pnn  n ! , es decir, en el caso
anterior de las permutaciones de los numeros 1, 2, 3 y 4 pudimos ver que estaba dada por:
Permutaciones con Permutaciones con Permutaciones con Permutaciones con

1 1, 2 1, 2, 3 1, 2, 3, 4
P11  1!  1 P22  2 !  2 P33  3 !  6 P44  4 !  24
Para ilustrar el uso de las fórmulas para calcular permutaciones, analicemos los siguientes ejemplos:
Se tienen telas de 4 colores diferentes y Laurita quiere confeccionarse un traje bicolor

(saco y falda). ¿De cuántas maneras se puede confeccionar el traje tomando en cuenta sólo los colores,
pero no el modelo?
Realicemos el análisis combinatorio. Tenemos 4 colores diferentes y vamos a escoger dos, entonces,
n=4 y r=2, con lo que sustituimos en la expresión:
C1 C2 C3 C4
C2 C3 C4 C1 C3 C4 C1 C2 C4 C1 C2 C3
n! 4! 4! 2! 3  4
P24   P24     3  4  12 maneras de confeccionar el traje.
(n  r )! (4  2)! 2! 2!
El grupo 6IM3 con 32 estudiantes debe elegir un presidente, secretario y un vocal.

Todos pueden ser elegidos pero una persona no puede tener más de un cargo ¿De cuántas maneras
diferentes puede realizarse la elección?
Observe que, los arreglos posibles son permutaciones, pues, el orden en cada uno sí es de interés.
Determinemos el número de permutaciones que se generan, de modo que hay
IPN 127 CECYT-18

32! 32!
P432    29,760 , o bien 32  31  30  29,760 posibles formas de elegir a los
(32  3)! 29!
representantes del grupo.
¿Cuál es el número de permutaciones de tres números usando 1, 2, 3, 4, 5, 6, 7, 8, 9?
Determinemos el número de permutaciones de números, de modo que hay

9! 9! (6!)  7  8  9
P39     7  8  9  504 permutaciones.
(9  3)! 6! 6!
¿Cuántas palabras de 3 letras (aunque no tengan sentido) se pueden generar con la

palabra FRIDA?
5! 5!
a) Observe que, para los arreglos (permutaciones), hay P3 
5
  60 posibles palabras.
(5  3)! 2!
b) Podemos resolverlo utilizando tambien diagramas de árbol, que en este caso sería:
F R I D A Observe que solo hemos completado

R I D A una posibilidad con la letra F para la
I cual, tenemos 4 posibilidades para la
segunda letra y, finalmente tres
D
posibilidades para la tercer letra; asi,
A
tenemos 1  4  3  12 arreglos en la
primera opcion y observe que tenemos 5 arreglos iguales, uno por cada letra de la palabra FRIDA,
con un total de 12  5  60 arreglos distintos.
c) Consideremos un arreglo de la forma: ___ ___ ___ donde en la primera línea puede ir
cualquiera de las cinco letras; en la segunda casilla nos quedan 4 letras disponibles y así
sucesivamente, de modo que tenemos 5  4  3  60 arreglos distintos con las letras de la palabra
FRIDA.
En la clase de Biología humana que cuenta con 35 alumnos se van a entregar 3

premios distintos a los mejores aprovechamientos del curso. Calcule de cuántas maneras se pueden
entregar los premios si una persona no puede recibir más de un premio.
IPN 128 CECYT-18

Sabemos que hay 35 alumnos candidatos a ganar los premios, de modo que, en este caso el orden sí
importa y que sólo hay tres premios y un estudiante no puede ganar más de un premio; entonces,
35! 35!
aplicamos la fórmula para permutaciones, con lo que, obtenemos P3 
35
  39,270 , o
(35  3)! 32!
bien, 35  34  33  39,270 formas de entregar los tres premios.
¿De cuántas formas distintas se pueden colocar 5 libros de cálculo diferencial y 6 de

Cálculo integral todos de distinto autor en una estantería, teniendo en cuenta que los de la misma
área deben estar juntos?
Analicemos que el problema resalta el orden en el que se colocan los libros, ya que, los de la misma
materia deben estar juntos; así, en el primer caso tendremos un total de 5 libros y en el segundo un
total de 6.
Así la solución al problema sobre las formas en las que se pueden ordenar los libros en la estantería
5! 6! 5! 6!
con las condiciones dadas será de P55  P66      86, 400 , o bien,
(5  5)! (6  6)! 1 1
P55  P66  (5!)(6!)  86,400 formas distintas considerando que primero colocamos los de cálculo
diferencial y posteriormente los de cáculo integral; de modo que, debemos considerar tambien los
arreglos si colocamos primero los de cálculo integral y posteriormente los de cálculo diferencial; así,
tenemos 86,400  2  172,800 formas de ordenarlos.
Permutación con repetición. Una permutación de n elementos y k grupos de

elementos repetidos es el número de arreglos de n objetos de los cuales, n1 son de
una clase, n2 son de una segunda clase, …, nk son de la k-ésima clase y
n1  n2  ...  nk  n , entonces, la cantidad de arreglos diferentes que se pueden
obtener está dada por:
n ,n2 ,...,nk n!
PRn 1 
n1 !  n2 !  ...  nk !
Para ilustrar el uso de las permutaciones con elementos que se repiten consideremos el siguiente
ejemplo:
IPN 129 CECYT-18

¿Cuántas palabras distintas (con o sin sentido) pueden escribirse con las letras de la
palabra MEME?
Si consideramos al conjunto de las letras de palabra MEME como si todas fueran diferentes, entonces,
tendríamos lo siguiente:
M E Si agregamos una tabla con cada uno de los resultados,

E
E M tenemos lo siguiente:
E E
M M
E E
E M
E
M E
E M
M MEME MEEM MMEE EMEM EMME EEMM
M E
M M
MEME MEEM MMEE EMEM EMME EEMM
E E
M M MEME MEEM MMEE EMEM EMME EEMM
E M MEME MEEM MMEE EMEM EMME EEMM
M
M E
M E
E
E M
E E
M M
E E
E M
E
M E
E M
M
M E
M M
E E
M M
E M
M
M E
Si consideramos cada letra distinta tendríamos 4!  24 palabras.
En la tabla, cada cuatro palabras se repiten o bien, equivalen a una palabra, entonces, tenemos un
total de 24  6 palabras para este caso.
4
4!
Haciendo uso ahora de la fórmula para permutaciones con repetición tendremos PR4 
2,2
6
2! 2!
palabras.
¿En cuántas de esas palabras distintas, las M aparecen juntas?
IPN 130 CECYT-18

Vamos a considerar en este caso a las M como una sola letra, es decir, el problema se limita a generar
las palabras distintas en el entendido de que donde aparece la M son dos M juntas; luego, tenemos
3!
PR31,2   3 palabras en las cuales las M aparecen juntas, que si revisamos la lista de arriba
(1!)(2!)
podemos ver que son tres.
Maziel tiene un estuche para resistencias, el cual contiene, dos resistencias con raya
color verde, tres con raya color café y cuatro con raya color blanco. ¿De cuántas formas diferentes
puede Maziel ordenarlas en un proto para la clase de circuitos electrónicos?
Sean n1  2 resistencias con raya verde, n2  3 resistencias con raya café y n3  4 resistencias con
raya blanca; además, n  n 1  n 2  n 3  9 resistencias en total. Para encontrar la cantidad de
n ,n2 ,...,nk n!
PRn 1 
n1 ! n2 ! ...  nk !
permutaciones o arreglos que maziel puede lograr, tenemos que:
9! 362, 880
PR92,3,4    1, 260
2! 3! 4! 288
arreglos para las resistencias.
¿Cuántas maneras distintas existen para ordenar las letras de la palabra

POLITECNICO?, ¿En cuántas de estas permutaciones las letras C quedan juntas?
Vamos a considerar la cantidad de veces que se repite cada una de las letras de la palabra
POLITECNICO, es decir:
Una vez que tenemos el conteo, podemos calcular el número de permutaciones en que
podemos ordenar la palabra POLITECNICO, que serán:
11! 39916800
PR111,2,1,2,1,1,2,1    4,989,600 formas de
(1!)(2!)(1!)(2!)(1!)(1!)(2!)(1!) 8
ordenar las letras.
Para determinar en cuantas ocasiones las C quedan juntas debemos considerar a las
dos como una sola letra, por tanto, tenemos que:
10! 3,628,800
PR101,2,1,2,1,1,1,1    907,200 formas de ordenar
1! 2! 1! 2! 1! 1! 1! 1! 4
las letras.
IPN 131 CECYT-18

Permutaciones circulares
ene
Una Permutación circular (sin repetición). Se llama permutación circular (sin
repetición) de n elementos, que denotamos por PC n , a los distintos grupos que se
pueden formar, de tal manera que en cada grupo entre los n elementos se diferencie
de los demás en la posición relativa. De este modo se tiene que:
PC nn  (n  1)!
La definición nos explica que podemos utilizar la permutación circular cuando los elementos deben
ordenarse en círculo, además debemos tomar en cuenta que:
1. El orden importa
2. Los elementos se ordenan en circulo
3. Todos los elementos se toman en cuenta.
Para aclarar la formula analizaremos los siguientes dos ejemplos:
¿De cuantas formas diferentes se pueden sentar 3 personas en línea recta y en circulo?
Para ordenar a las tres personas en Para ordenar a las tres personas círculo
linea recta nos da como posibilidades nos da como posibilidades
ABC En este caso tenemos 6 posibles

ACB formas distintas de ordenar a las tres
BCA personas en línea recta, es decir
BAC 3!  6 formas distintas. Si las
CBA ponemos en posicion circular por
CAB cada n elementos tenemos n
posiciones que se repiten, es decir, En este caso tenemos PC 3  (3  1)!  2 !  2
ABC, BCA y CAB si las colocamos formas distintas de sentar a tres personas en
en circulo, generan la misma forma circular.
posicion; luego, tenemos:
n ! (n )(n  1)!
  (n  1)!
n n
IPN 132 CECYT-18

¿De cuantas formas pueden siete personas sentarse alrededor de una mesa circular?
Haciendo uso de las permutaciones circulares sin repetición tenemos PC 77  (7  1) !  6 !  720

formas distintas.
En un grupo de 7 amigos, hay una pareja de novios. Se ha organizado una lunada

con fogata, ¿De cuántas maneras pueden sentarse alrededor de la fogata si los novios deben sentarse
siempre juntos?
En primer lugar, vamos a mostrar algunos posibles ordenamientos para darnos una idea de la
situacion, es decir:
Observando que P1 y P2 son la pareja que siempre van a querer estar juntos, podemos considerarlos
como un solo elemento, es decir, haciendo uso de las permutaciones circulares sin repetición tenemos
PC 6  (6  1)!  5 !  120 formas distintas de sentarse alrededor de la fogata si consideramos a la
pareja como un solo elemento, pero debemos considerar que se hizo el cálculo sin considerar lo
siguiente:
Lo que ilustra la imagen es que, en un caso se sentaron la pareja P1 y P2 en este orden pero hemos
olvidado que tambien se cumple si se sientan como P2 y P1 . Por lo tanto, la cantidad de formas en
las que se pueden sentar los siete amigos considerando a la pareja siempre juntos estará determinada
por PC 6  (6  1)!  5 !  120  2  240 (observe que son las permutaciones para 5 elementos
multiplicadas por las permutaciones para dos elementos). Por lo tanto, hay 240 fomas distintas de
sentarse alrededor de la fogata.
IPN 133 CECYT-18

ESTANDARÍZATE 9
Resuelve cada uno de los siguientes problemas.
1. ¿De cuántas maneras tres parejas de esposos se 2. El grupo 6IM4 desea hacer una rifa para
pueden ubicar en una mesa circular para jugar sacar fondos para su graduacion, para ello
dados, si estas parejas juegan siempre juntas? deciden hacer boletos donde cada boleto
consta de un número de 4 cifras. Para generar
cada número participante se utilizaron los
digitos del cero al nueve, ¿Cuántos boletos
pueden hacer para la rifa sin repetirse ninguno
de los números?
3. El Profesor Ismael tiene 4 libros de 4. a) ¿Cuántas maneras distintas existen para

Probabilidad, 5 de Estadística y dos de Cálculo las letras de la palabra MATEMATICAS?, b)
integral que desea acomodar en su nuevo librero, ¿En cuántas de estas maneras de ordenar la
¿de cuántas formas los puede ordenar? Considere palabra, las letras A quedan juntas?
los libros de cada área de distinto autor.
5. Se deben colocar 5 hombres y 4 mujeres en fila 6. ¿De cuántas maneras diferentes se pueden
de modo que las mujeres ocupen los lugares pares, sentar 7 personas en una mesa redonda, si una
¿de cuántas maneras puede hacerse? persona se sienta al centro y las otras 6 a su
alrededor?
IPN 134 CECYT-18

7. Determinar el número de permutaciones que 8. Calcular las permutaciones de 6 bolas del
se pueden hacer con las letras de la palabra mismo tamaño y forma, pero de diferente color
“COLOCAR”. si se toman 4 bolas, una tras otra, y se ponen en
línea.
9. Encontrar de cuantas formas diferentes se 10. ¿Cuántas banderas tricolor se pueden formar
pueden acomodar 3 donas de chocolate, 4 con tres franjas de tela, una roja, una azul y otra
glaseadas y dos de cajeta en una caja, con amarilla, pudiéndose repetir los colores, pero sin
capacidad para nueve piezas. poner dos bandas consecutivas del mismo color?
11. Un dado es tirado 5 veces. Considerando el 12. ¿Cuántas claves para acceder a una
orden de los tiros, ¿de cuántas maneras pueden computadora se pueden obtener con los números
ocurrir 2 números 2, un número 3, 1 número 4 y 2, 2, 2, 3, 5, 5, 5, 5, 5?, ¿Cuántas de las claves
1 número 6? anteriores empiezan por un 2 seguido de un tres?
13. El equipo de Volibol femenil de cecyt-18 14. Obtenga todas las permutaciones posibles
participa 9 juegos esta temporada, ¿cuántas que se pueden obtener con las letras de la
maneras hay de que en estos 9 juegos en los que palabra AMA y descríbalas de forma explícita.
participan, obtengan 4 victorias, 3 empates y ¿En cuántas de ellas las letras A aparecen
dos juegos perdidos? juntas?
IPN 135 CECYT-18

Teoría de las probabilidades
La teoría de probabilidades tiene sus inicios por el año de 1654 en relación a problemas relacionados
con los juegos de azar.
La teoría de la probabilidad se encarga de asignarle un cierto valor a cada posible resultado que
pueda suceder en un experimento aleatorio, con la finalidad de cuantificar los resultados y, con ello,
saber si un suceso es más probable que otro. Por ejemplo:
Imagine que lanzamos dos dados y registramos la suma de los puntos obtenidos, ¿Cuál es la
probabilidad de que se obtenga una suma mayor a 8?
Imagine que lazamos una moneda 3 veces y nos preguntamos ¿Cuál es la probabilidad de
obtener al menos 2 águilas?
Imagine que una familia tiene tres hijos, ¿Cuál es la probabilidad de que al menos dos sean
mujeres?
Todos estos ejemplos nos dan razón de ese valor que podemos asignarle a cada posible resultado de
un determinado experimento aleatorio y con ello calcular su probabilidad.
Un experimento aleatorio es un ensayo u operación cuyo resultado no puede

predecirse.
Si elegimos al azar 30 personas y las encuestamos sobre su preferencia por alguna bebida
saborizada en particular, el resultado de este ensayo es un experimento aleatorio.
Si lanzamos 20 veces un dado y anotamos el número que aparece cada vez en la parte superior,
el resultado es un experimento aleatorio.
Seleccionar un producto elaborado por una empresa para hacer un control de calidad, etc.
Un espacio muestral es el conjunto de todos los resultados posibles obtenidos de un

experimento aleatorio y se denota por la letra S.
Lanzar una moneda una vez, entonces, el espacio muestral será S  {A, S}
Arrojar una moneda dos veces, entonces, el espacio muestral será
S  {(A, S),(A, A),(S, A),(S, S)}
Una familia tiene tres hijos, entonces, el espacio muestral determinado por el sexo de los hijos
está dado por S  {MMM, HHM, HMH , HMM, MHH , MHM, MMH , MMM}
IPN 136 CECYT-18

Se denomina evento o suceso a cualquier subconjunto del espacio muestral S.
Puede ser que no sólo estemos interesados en resultados inviduales de un experimento
sino que, pueden interesarnos colecciones o conjuntos de ellos. A los eventos los
denotaremos generalmente por las primeras letras mayúsculas del abecedario, es
decir, A, B, C, …, etc.
Un evento simple consiste de un único evento de un experimento, por

ejemplo, obtener un 3 al lanzar un dado.
Un evento compuesto consiste de más de un evento individual, por ejemplo,
obtener un número par al lanzar un dado al azar ya que, ocurre de más de una
forma, 2, 4 o 6.
Como un evento o suceso es un conjunto, valen las mismas relaciones que en la teoría de conjuntos,
es decir, si por ejemplo, los conjuntos A, B y C son eventos del Universo, entonces, los conjuntos
Ac , A  B , Ac B , etc, tambien son eventos del universo y tienen una interpretación. Algunas
interpretaciones sobre sucesos o eventos son las siguientes:
EVENTO REPRESENTACIÓN DEL DIAGRAMA DE VENN

EVENTO CON TEORIA DE
CONJUNTOS
“Ocurre el suceso A” A
“No ocurre el suceso A” A'

“Por lo menos ocurre uno de
los dos sucesos” A B
“Ocurre A y ocurre B”
A B
“Ocurre A pero no ocurre B” A B'
“Ocurre A y no ocurre B” AB
“Ocurre A y no ocurren ni B A  (B  C )
ni C” A  B ' C '
“A, B y C ocurren a la vez” A  B C
IPN 137 CECYT-18

Probabilidad Clásica
La teoría de probabilidades bajo el enfoque clásico se basa principalmente en el supuesto de que cada
resultado es igualmente probable en su ocurrencia. Este enfoque descansa sobre las siguientes
condiciones:
El espacio muestral S del experimento es finito.

Los resultados del espacio muestral deben ser igualmente probables, es decir, tienen la
misma probabilidad de ocurrir.
Algunas notaciones importantes que vamos a necesitar para el estudio de la probabilidad son las
siguientes:
P denota una probabilidad.

A,B,C denotan eventos específicos de un experimento.
P(A) denota la probabilidad de que ocurra el evento A.
La probabilidad de que ocurra un evento se mide siempre por un número entre cero y uno,
es decir, 0  P(A)  1 .
La probabiliadad de un evento imposible siempre es cero, o bien, si un evento nunca ocurre,
su probabilidad es cero.
Si un evento ocurriese siempre su probabilidad es 1.
Suponga, entonces que realizamos un experimento aleatorio. Vamos a denotar por:
a. n(S) al número total de elementos del espacio muestral, o bien, es el número total de
eventos simples distintos posibles al realizar un experimento.
b. n(A) denota el número total de formas distintas en que A puede ocurrir.
Así, la probabilidad de que ocurra A la definimos como:
n(A) número de eventos favorables

P (A)  
n(S ) número de eventos posibles
Se lanza un dado al azar,
A. ¿Cuál es la probabilidad de obtener un 3?

B. ¿Cuál es la probabilidad de obtener un número impar?
IPN 138 CECYT-18

A. Utilizando la teoría de las probabilidades clásica, tenemos que A es el evento de obtener un 3 al
lanzar el dado al azar.
Nuestro espacio muestral es S  {1,2,3,4,5,6} y todos los resultados son igualmente probables.
Además, A puede ocurrir de una sola forma (obtener un 3), por lo tanto, n(A)  1 y n(S)  6 ,
n(A) 1
entonces, la probabiliad de obtener un 3 al lanzar un dado es de P(A)    0.166
n(S ) 6
B. Utilizando la teoría de las probabilidades clásica, tenemos que A es el evento de obtener un número
impar al lanzar el dado al azar.
Nuestro espacio muestral es S  {1,2,3,4,5,6} y todos los resultados son igualmente probables.
Además, A puede ocurrir de tres formas distintas (Obtener un 1, 3, 5), por lo tanto, n(A)  3 y
n(S)  6 , entonces, la probabiliad de obtener un número impar al lanzar un dado es de
n(A) 3
P(A)    0.5
n(S ) 6
Determine la probabilidad de que exactamente dos de los tres hijos de una pareja
sean varones. Suponga que es igualmente probable dar a luz a un niño que, a una niña y, que el
género de cualquier hijo no influye en el género del otro.
Utilizando la teoría de las probabilidades clásica, tenemos que A es el evento de obtener exactamente
dos varones.
Nuestro espacio muestral será:
Niño El espacio muestral está dado por:

Niño
Niña Interés S  {(MMM),(MMH),(MHM),(MHH),
Niño y
Niño Interés (HMM),(HMH),(HHM),(HHH)}
Niña todos los resultados son igualmente
Niña probables; además, A puede ocurrir de tres
Niño Interés formas
Niño A  {(MHH),(HMH),(HHM)} por lo
Niña tanto, n(A)  3 y n(S)  8 , entonces, la
Niña
Niño probabiliad de que si una pareja tiene tres
Niña hijos y dos de ellos sean varones está dada
Niña n(A) 3
por P(A)    0.375
n(S ) 8
IPN 139 CECYT-18

Probabilidad Frecuencial
Otro enfoque para definir probabilidades es el enfoque frecuencial o empírico. Considere por ejemplo:
cuando se trata de determinar cuál es la probabiliad de que un automovil tenga un accidente en un
año, se deben analizar resultados de años previos para determinar el número de automóviles en uso
durante un año, y el número de estos que se accidentaron. Despues, se calcula la razón entre el
número de automoviles que sufrieron un accidente y la cantidad total de automoviles .
Enfoque frecuencial (empírico). La teoría de probabilidades bajo el enfoque frecuencial se basa

en la frecuencia relativa de ocurrencia de un evento respecto a un gran número de repeticiones del
experimento. En otras palabras, se basa en el número de veces que ocurrió el evento entre el número
total de repeticiones del experimento.
Este tipo de enfoque de probabilidad no implica ningún supuesto previo de igualdad de

probabilidades.
Si queremos conocer la probabilidad del evento A según este enfoque realizamos el experimento un
gran número de veces y contamos cuántas veces ocurre A. Con base en estos resultados, P(A) se
estima de la siguiente forma:
número de veces que ocurrió A

P(A) 
número de veces que se repitió el experimento
Una urna contiene una cantidad desconocida de monedas de $1, de $2, de $5 y de

$10 de las cuales, queremos elegir una al azar. Para poder determinar la probabilidad de cada evento
posible, se seleccionaron 50 monedas al azar con reemplazo (la moneda seleccionada vuelve a
regresarse a la urna una vez sacada para la próxima selección). La siguiente tabla muestra las
frecuencias (veces que ocurren) de cada una de las monedas.
De acuerdo con los datos, si seleccionamos una moneda al azar,
a. ¿Cuál es la probabiliad de que sea de a $10?
b. ¿Cuál es el evento menos probable?
c. ¿Cuál es el evento que podemos predecir, es decir, el evento más probable?
IPN 140 CECYT-18

Moneda Frecuencia
$1 5
$2 18
$5 12
$10 15
Total 50
Para responder a cada uno de los incisos, consideremos que no concemos el número de monedas de
cada cantidad existentes en la urna, por lo que, no podemos utilizar la probabilidad clásica para
encontrar la probabilidad de cada evento posible. Entonces,
a. Si A= “tomar una moneda de $10”

15 3
P(A)    0.30
50 10
b. El evento menos probable en este caso, será el de menor frecuencia, es decir, B= “evento
menos posible” que sería sacar la moneda de $1 con la siguiente probabilidad:
5 1
P(B)    0.1
50 10
c. Sea C= “evento más probable”. El evento que debemos predecir en este caso es el evento con
una mayor frecuencia, es decir, sacar una moneda de $2 con una probabilidad de:
18
P(C)   0.36
50
Calcule la probabilidad de que un automóvil seleccionado al azar en Estados Unidos

se accidente durante este año.
Consideremos que, en un año reciente, de un total de 135,670,000 automóviles registrados en estados

Unidos, 6,511,100 se accidentaron, luego, utilizando la probabilidad frecuencial podemos calcular que
6,511,100
la probabilidad de que un automóvil se accidente es de P(accidente)   0.048
135,670,000
Observe que al calcular probabilidades con el método de frecuencias relativas obtenemos una
aproximación en vez de un valor exacto. A mayor número de veces que repitamos el experimento,
más cerca estará la probabilidad del valor real.
IPN 141 CECYT-18

Eventos compuestos
Estos se forman combinando dos o más eventos simples. Haciendo uso de la notación de conjuntos
nos introducimos a su estudio de la siguiente forma:
Sean A y B dos eventos de un mismo espacio muestral S,

La unión de A y B entonces:
(Regla de la suma)
La unión de A o B ( A  B ) es el conjunto de todos los
elementos que están en A o están en B o están en ambos.
En un grupo de 10 estudiantes, hay 3 que toman la materia de control de

enfermedades, 4 que toman biología animal y dos que toman ambas materias. Encuentre la
probabilidad de que, al seleccionar un estudiante al azar, este, tome el curso de biología animal o el
curso de control de enfermedades.
Para calcular la probabilidad de que, al elegir un

estudiante al azar, este tome el curso de biología animal
o control de enfermedades, estará determinada por:
n(CE  BA)  n(CE)  n(BA)  n(CE  BA)

n(CE  BA)  3  4  2  5
5
Luego la probabiliadad P(CE  BA)   0.5
10
Sean A y B dos eventos de un mismo espacio muestral S,

entonces:
La intersección de A y B
La intersección de A y B ( A  B ) es el conjunto de todos los
elementos que están en A y están en B.
IPN 142 CECYT-18

En un grupo de 10 estudiantes, hay 3 que toman la materia de control de
enfermedades, 4 que toman biología animal y dos que toman ambas materias. Encuentre la
probabilidad de que, al seleccionar un estudiante al azar, tome el curso de biología animal y el curso
de control de enfermedades.
Para calcular la probabilidad de que, al elegir un

estudiante al azar, este tome el curso de biología animal
y control de enfermedades, estará determinado por
2
P(CE  BA)   0.2
10
Es el evento que reúne todos La probabilidad de que no

El complemento de A, los elementos de S que no ocurra A es la misma que la
denotado por A' están en A. probabilidad de que ocurra su
A' ocurre cuando A no ocurre complemento y se denota por
y viceversa. P (A ')
Un grupo con 30 personas está compuesto por 8 hombres, 12 mujeres, 7 niños y 3

niñas. Encuentre la probabilidad de que, al elegir a una de estas personas al azar, ésta no sea niño.
Analicemos que, de las 30 personas, 7 son niños y, por lo tanto, 23 no son niños, de modo que, la
probabilidad de elegir a una persona y esta no sea niño es lo mismo que
23
P(niñoc )   0.767
30
Podemos calcular la probabilidad a través del complemento, es decir, la probabilidad de que al

elegir una persona, esta no sea un niño estaría dada por
7
P(niñoc )  1  P(niño)  1   1  0.233  0.767
30
IPN 143 CECYT-18

Dado el siguiente diagrama de Venn, determine:
c. A d. B
c c
a. A  B b. A  B
Si analizamos nuestro diagrama de Venn, podemos calcular el espacio muestral, es decir,

S  {1,2,3, 4,5,6,7,8} . Con estos datos podemos calcular cada uno de los valores que nos solicitan:
a. A  B  {1,2, 4,5,7,8} b. A  B  {2,8} c. Ac  {3, 4, 5, 6} d. B c  {1, 3, 6, 7}
Sea S  {1,2,3,4,5,6,7,8,9} , el conjunto A  {2,3,5, 7,9} y el conjunto

B  {1, 2, 4,5,7} , encuentra las siguientes probabilidades:
a. P(A  B) b. P(A  B) c. P(A )

c
d. P((A  B) )
c
e. P(A  B )
c c
En este caso vamos a construir un diagrama de Venn que nos ilustre la situación para poder calcular
las probabilidades que nos solicitan; luego, observemos:
7
a. P(A  B)   0.777
9
3
b. P(A  B)   0.333
9
4
c. Ac  {1, 4, 6, 8} , por tanto, P(A )   0.444
c
2
d. (A  B )c  {6, 8} , por tanto, P((A  B) )   0.222
c
6
e. Ac  B c  {1, 3, 4, 6, 8, 9} , por tanto, P(A  B )   0.667
c c
IPN 144 CECYT-18

Sea S un espacio muestral, tal que, P(A)  0.3 , P(B )  0.4 y P(A  B)  0.1 .
Encuentra las siguientes probabilidades.
a. P (A  B ) b. P (A  B ') c. P(B )
c
d. P(A )
c
En este caso vamos a construir un diagrama de Venn que nos ilustre la situación para poder calcular
las probabilidades; observemos que P(A)  0.3 , P(B )  0.4 y P(A  B)  0.1 . Señale tambien que
P(S)  1
a. P(A  B)  0.2  0.1  0.3  0.6
b. P (A  B c )  0.2
c. P (B c )  0.4  0.2  0.6
d. P (Ac )  0.4  0.3  0.7
Dos eventos A y B son mutuamente excluyentes o disjuntos si, AB  , es decir, si

A y B no tienen elementos en común.
Para ilustrar la definición anterior considere, por ejemplo, sea U  {1,2,3,4,5,6} y sean A  {2, 4,6}
y sea B  {1,3,5} . Por lo tanto AB   son disjuntos.
Eventos que son mutuamente excluyentes

Lanzamos un dado. Entonces,
podemos declarar los siguientes sucesos:
A: El dado cae en número impar
B: El dado cae en número par
En este caso los sucesos son mutuamente
excluyentes ya que la intersección es vacía, es
decir, si lanzamos un dado no puede caer par e
impar al mismo tiempo.
AB  , luego, P(A  B)  P(A)  P(B)
IPN 145 CECYT-18

Regla de la suma
Frecuentemente es más fácil conocer la probabilidad de un evento a partir de otros eventos conocidos.
Para ello vamos a definir las siguientes reglas:
Si A y B son cualesquiera dos eventos, entonces Si A y B son mutuamente excluyentes,

entonces se cumple que
P(A  B)  P(A)  P(B)  P(A  B) P(A  B)  P(A)  P(B)
Si A1  A2  ...  A n es una partición del espacio muestral S , entonces,
P(A1  A2  ...  An )
 P(A1 )  P(A2 )  ...  P(An )
 P(S )
1
La probabilidad para tres eventos A, B y C, está dada por:
P(A  B  C )  P(A)  P(B)  P(C )  P(A  B)  P(A  C )  P(B  C )  P(A  B  C )
¿Cuál es la probabilidad de obtener un 7 o un 11 al lanzar un par de dados?
Declaramos dos eventos:
A= “Se obtiene un 7”
B= “Se obtiene un 11”
Creamos las posibilidades para cada uno de los casos, para ello utilizamos un diagrama de árbol.
1 2 3
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
7 7 7
4 5 6
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
7 7 11 7 11
Observe que se tienen un total de 66  36 formas de obtener un resultado en nuestro espacio
muestral S . Para obtener como respuesta 11, tenemos dos posibilidades y para el caso de obtener
un 7, tenemos 6 posibilidades. Observe que se trata de eventos mutuamente excluyentes
pues un total de 7 y 11 no puede ocurrir en el mismo lanzamiento.
De este modo, la probabilidad de obtener un 7 o un 11 está dada por

6 2
P(A B)  P(A)  P(B)    0.2222
36 36
IPN 146 CECYT-18

2
La probabilidad de que Sara apruebe Probabilidad es de y la probabilidad de que
3
4 1
apruebe redes es de . Si la probabilidad de aprobar ambos cursos es de ,
9 4
a) ¿Cuál es la probabilidad de que sara apruebe al menos uno de estos cursos?
b) ¿Cuál es la probabilidad de que sara apruebe únicamente redes?
c) ¿Cuál es la probabilidad de que sara apruebe sólo uno de los cursos?
P= “Aprobar probabilidad”
R= “Aprobar redes”
a) Haciendo uso de la regla de la adición, tenemos que:
2 4 1 31
P(P  R)  P(P)  P(R)  P(P  R)      0.8611
3 9 4 36
b) La probabilidad de que apruebe únicamente redes, está dado por:
4 1 7
P(R  P)  P(R)  P(R  P)     0.1944
9 4 36
c) La probabilidad de que apruebe únicamente uno de los dos cursos está dada por:
P(P R)  P(R  P)  P(R  P)  P(R)  P(P)  P(R  P)  P(R  P)

4 2 1 1 11
      0.6111
9 3 4 4 18
Un comité está formado por 8 hombres y 12 mujeres. Se van a elegir cinco

representantes para la mesa directiva.
a. Encuentra la probabilidad de que exactamente 3 de los 5 representantes sean mujeres.
b. Encuentra la probabilidad de que al menos 3 de los cinco representantes sean mujeres.
Nuestro espacio muestral está formado por todas las formas de elegir cinco representantes, lo cual,
nos lleva al cálculo de combinaciones de 20 personas tomadas de cinco a la vez; entonces, el número
IPN 147 CECYT-18

20!
de mesas directivas distintas de cinco personas está dada por C5 
20
 15,504 formas
5!(20  5)!
distintas. Sean los sucesos:
A= “la mesa directiva contiene exactamente 3 mujeres”
B= “la mesa directiva contiene exactamente 4 mujeres”
C= “la mesa directiva contiene exactamente 5 mujeres”
12!
a. Las formas distintas de elegir a tres mujeres de 12, está dada por C3 
12
 220 formas.
3!(12  3)!
Para elegir a dos hombres para completar la mesa directiva, lo hacemos a través de
8!
C 28   28 ; así, tenemos que:
2!(8  2)!
# de mesas directivas con 3 mujeres y 2 hombres (220)(28)

P(A)    0.397
# total de mesas directivas formadas por 5 personas 15,504
b. Para encontrar la probabilidad de que al menos 3 de los cinco representantes de la mesa directiva
sean mujeres debemos calcular las posibilidades para 3, 4 y 5 mujeres, es decir:
12! 8!
Si hay 3 mujeres tenemos C3 
12
 220 y dos hombres; entonces, C28   28
3!(12  3)! 2!(8  2)!
12!
Si hay 4 mujeres tenemos que C 4 
12
 495 y habrá 1 hombre; entonces,
4!(12  4)!
8!
C18  8
1!(8  1)!
12!
Si hay 5 mujeres tenemos que C5 
12
 792 y habrá 0 hombres; entonces,
5!(12  5)!
8!
C 08  1
0!(8  0)!
Luego, la probabilidad de que al menos 3 de los cinco representantes de la mesa directiva sean
mujeres estará dada por:
(220)(28) (495)(8) (792)(1)

P(A  B  C )     0.704
15, 504 15, 504 15, 504
IPN 148 CECYT-18

Si A y A’ son eventos mutuamente excluyentes, entonces,
P(A)  P(A')  1
P(A')  1  P(A)
P(A)  1  P(A')
Si las probabilidades de que un mecánico automotríz dé servicio a tres, cuatro, cinco, seis, siete, ocho
o más vehículos en un día de trabajo son de 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07, respectivamente, ¿Cuál
es la probabilidad de que dé servicio al menos a cuatro autos el siguiente día de trabajo?
Declaramos el evento:
A= “Al menos cuatro autos reciban servicio”
Tenemos que P(A') es la probabilidad de que exactamente tres vehículos reciban servicio, es decir,
P(A ')  0.12
Por la definición anterior, tenemos que P(A)  1  P(A')  1  0.12  0.88 , es decir, la probabilidad
de que al menos cuatro vehículos reciban servicio automotriz el siguiente día.
Se les aplica un examen a 40 estudiantes que aspiran a entrar a alguna carrera de nivel
superior. La siguiente tabla muestra los resultados obtenidos por género.
Si se selecciona al azar a un de los estudiante, encuentre la probabilidad de que:
a. Sea hombre o aprobó el examen.
b. Sea mujer o reprobó el examen.
c. Sea mujer y reprobó el examen.
Masculino Femenino
Aprobó 7 2 9
No aprobó 18 13 31
25 15 40
IPN 149 CECYT-18

A= “El estudiante es hombre”

B= “El estudiante aprobó el examen”
a. Utilizando la regla de la suma, tenemos que la probabilidad de que el estudiante sea hombre o
25 9 7
aprobó el examen está dada por P(A  B)  P(A)  P(B)  P(A B)     0.675
40 40 40
b. Utilizando la regla de la suma, tenemos que la probabilidad de que el estudiante sea mujer o
15 31 13
reprobó el examen está dada por P(A' B ')  P(A')  P(B ')  P(A' B')     0.825
40 40 40
c. Para calcular la probabilidad de que el estudiante sea mujer y reprobó el examen está dada por:
P(A ' B ')  P(A ')  P(B ')  P(A ' B ')  (Despejamos) P(A ' B ')  P(A ')  P(B ')  P(A ' B ')
15 31 33
P(A ' B ')     0.325
40 40 40
De un grupo de 200 estudiantes, 137 toman clases de matemáticas, 50 toman clases

de historia, 124 toman clase de arte, 33 toman clase de historia y matemáticas, 29 toman clase de
arte e historia, 92 toman clase de arte y matemáticas y 18 toman los tres cursos. Si elegimos a un
estudiante al azar, ¿Cuál es la probabilidad de que tome al menos una de esas clases?
Vamos a declarar los eventos:
M= “El estudiante toma clase de matemáticas”

H= “El estudiante toma clase de historia”
A= “El estudiante toma clase de arte”
Luego asociamos las probabilidades respectivas para cada uno de los eventos que se describen en el
enunciado de la siguiente forma:
137 50 124
P (M )   0.685 P (H)   0.25 P (A)   0.62
200 200 200
33 29 92
P (H  M )   0.165 P(A  H )   0.145 P (A  M )   0.46
200 200 200
18
P(M  H  A)   0.09
200
IPN 150 CECYT-18

En este caso nos piden la probabilidad de que un estudiante tomado al azar, tome al menos una de
esas clases, es decir:
P(M  H  A)  P(M )  P(H )  P(A)  P(M  H )  P(M  A)  P(H  A)  P(M  H  A)

 0.685  0.25  0.62  0.165  0.145  0.46  0.09  0.875
Haciendo uso del complemento tenemos que P(M  H  A)  1  P((M  H  A')) ; por otra parte,
sabemos que son 175 estudiantes los que toman al menos alguna de las clases de modo que, serán 25
los que no toman ninguna de ellas, lo cual nos lleva a N (M  H  A)'  25
25 7
Finalmente, la probabilidad buscada estará dada por P(M  H  A)  1    0.875
200 8
Una urna contiene 15 bolas numeradas del 1-15, de las cuales, 5 son rojas, cuatro
blancas y 6 son azules, todas idénticas en forma y tamaño. Se seleccionan dos bolas de la urna.
Calcule la probabilidad de que exactamente una de ellas sea azul, si se extraen:
a) Una tras otra sin reemplazo.
b) Las dos a la vez.
a) Para seleccionar dos bolas una tras otra sin reemplazo de un total de 15, tenemos 15 para la
primera opción y 14 para la segunda, de modo que, para seleccionar dos bolas de 15 sin reemplazo,
hay 15  14  210 formas de extraerlas. Para los eventos favorables, es decir, que exactamente una
de ellas sea azul, tenemos los siguientes casos: 1. La promera bola es azul y la segunda no, lo cual
ocurre de 6  9  54 formas. 2. La primera bola no es azul y la segunda sí, lo cual ocurre de 9  6  54
formas. Entonces, tenemos en total 108 maneras de obtener una bola azul y por lo tanto,
108
P(sólo una bola es azul)   0.5142
210
b) Como las bolas se van a seleccionar al mismo tiempo, hablamos de la extracción de 2 bolas de la
15 que hay en la urna, es decir, consideramos las formas diferentes de extraer dos elementos de 15 a
15!
través de combinaciones; así, C2 
15
 105 formas distintas de extraer dos bolas de manera
2!(15  2)!
simutánea. Los eventos favorables para los que exactamente una de ellas sea azul serán
C16  C19  6  9  54 formas.
54
Por o tanto, P(sólo una bola es azul)   0.2571
210
IPN 151 CECYT-18

ESTANDARÍZATE 10
1. Se tienen 15 computadoras de las cuales, 9 2. En una urna se colocan tres pelotas con los
son del modelo 345 y 6 del modelo 387. Si se números 1, 2 y 3 respectivamente. Si se extraen
venden 5 equipos: dos pelotas al azar, sin reemplazo, determina
a) ¿Cuál es la probabilidad de que de las 5 a) La probabilidad de que la suma de los
computadoras vendidas, 3 sean del modelo 345? números sea 5.
b) ¿Cuál es la probabilidad de que de las 5
computadoras vendidas al menos 4 sean del b) La probabilidad de obtener una suma menor
modelo 387? o igual a cuatro.
c) ¿Cuál es la probabilidad de que las 5
computadoras vendidas sean del mismo modelo?
3. ¿Cuál es la probabilidad de obtener por lo 4. Si se forman 10 personas en fila, ¿Cuál es la

menos un águila al lanzar una moneda al aire probabilidad de que dos de ellas, seleccionadas
cuatro veces? con anterioridad, queden juntas?
5. De 15 concursantes en una carrera de 6. El grupo 6IM1 tiene 15 alumnos y 20

bicicletas, seis tienen los ojos azules. Si se eligen alumnas. Si se elige al azar a un grupo de seis
tres finalistas, cuál es la probabilidad de que: estudiantes para exponer, determina la
a) las tres tengan los ojos azules probabilidad de que:
b) ninguna tenga los ojos azules a) los seis sean hombres
c) por lo menos una tenga los ojos azules b) 3 sean hombres y 3 sean mujeres
c) halla 4 mujeres en el grupo seleccionado
7. De una caja que contiene 8 galletas de fresa, 8. En un estacionamiento hay 8 autos ford, 9
5 de vainilla y 3 de chocolate se extrae una a la jetta y 11 toyota. Si se selecciona al azar un auto
azar. Determina la probabilidad de que sea: para revisión cual es la probabilidad de que
a) de fresa a) sea toyota o ford.
b) No de vainilla b) No sea ford
c) de fresa o de chocolate
9. De los 200 estudiantes que tiene el maestro 10. Se lanza una moneda y un dado de manera
Ismael en sexto semestre, 100 estudian simultánea. Sea el evento A: la moneda cae
probabilidad y estadística, 90 estudian química águila y B: el dado cae en número par.
y 60 estudian probabilidad y estadística y Determina P(A  B) .
química. Si se selecciona un estudiante al azar,
cual es la probabilidad de que:
a) sea un estudiante de PE o química.
b) que no estudie PE y química.
IPN 152 CECYT-18

1 1
11. Dado un experimento que 12. Sean los eventos P(A)  2 , P (B ) 
en el y
2
1 7 5
P(A B)  , P(A B)  y la P(A')  , P(A  B)  2 , determina:
4 8 8 3
determina: a) P(A')
a) P(A) b) P(A  B)
b) P(B) c) P(A' B ')
c) P(A  B ') d) P(A ' B ')
e) P(A  B)
13. Si se tira un dado tres veces, determina la 14. Un examen de contabilidad consta de 2
probabilidad de que: preguntas de falso y verdadero, 3 preguntas de
a) se obtenga el número cinco en los dos opción múltiple con 4 opciones de respuesta.
primeros tiros. ¿Cuál es la probabilidad de que un estudiante
b) se obtenga un 5 en exactamente dos de los responda correctamente a todas las preguntas
tres lanzamientos. del examen, si lo contesta al azar?
15. En el cecyt18, 4 profesores pueden ser 16. En una canasta hay 5 platanos, 4 naranjas y
seleccionados para asistir a proyecto aula; el dos mangos. ¿Cuál es la probabilidad de que al
director no sabe cuántos serán requeridos; puede escoger 2 frutas al azar por lo menos una sea
ser 1, 2, 3 o los 4. ¿Cuál es la probabilidad de mango?
que sean seleccionados sólo dos profesores?
17. En una bolsa hay 6 pelotas blancas y 8 rojas. 18. Se organiza un comité de seis personas en el
Se extraen simultánemente 3 pelotas. Calcula la que debe haber dos arquitectos de siete que hay
probabilidad de obtener: en la compañía y 4 ingenieros de los 9 que hay
a) Las tres blancas en la compañía.
b) Las tres rojas a) ¿Cuál es la probabilidad de que en el comité
c) No sean las tres blancas haya un ingeniero en particular?
d) Al menos una sea blanca b) ¿Cuál es la probabilidad de que en el comité
queden Noé y salvador que son ingenieros y
Lucia que es arquitécto?
19. Sebastian está jugando con 5 soldaditos 20. Vania y sus nueve amigas, se quieren formar
iguales, tres caballitos iguales y dos carritos en fila.
rojos. Los está ordenando en fila, a) ¿Cuál es la probabilidad de que Vania quede
a) ¿Cuál es la probabilidad de que en los 3 al frente de la fila?
primeros lugares de la fila queden los caballitos? b) ¿Cuál es la probabilidad de que los primeros
b) ¿Cuál es la probabilidad de que los dos cuatro lugares siempre estén ocupados por
carritos queden al final de la fila? Vania, Victor, Hatziry y Natasha?
IPN 153 CECYT-18

Regla del producto
Para calcular la probabilidad de que ocurra A y B al mismo tiempo, es decir, P(A  B) , se le
denomina regla del producto o multiplicación porque implica multiplicar la probabilidad del evento
A por la probabilidad del evento B. Recuerde que en este caso asociaremos el uso de la palabra “y”
con la regla del producto.
Luego, denotaremos a la probabilidad de la interseccion como:
P(A  B)  P(el evento A ocurre en un primero ensayo y el evento B ocurre en un segundo ensayo)
Para explicar la regla del producto, considere el siguiente ejemplo:
Considere las preguntas para el siguiente examen:
1. ¿La ecuación dada por x  3x  2  0 tiene como soluciones a x 1 y a x  2?

2
A) Verdadero B) Falso
2. ¿Cuál de las siguientes opciones es solución de la ecuación x  3x  2x  0 ?

3 2
A) x 0 B) x 3 C) x 4 D) x  1 E) x  2
Observe que, en este caso, la solución a los dos reactivos son A) para el primer problema y A) para
el segundo problema. Si calculamos las posibilidades a nuestro espacio muestral, tenemos que
S  {AA, AB, AC, AD, AE, BA, BB, BC, BD, BE}
A B
A B C D E A B C D E
Luego, en este caso tenemos 10 posibilidades y cada una de ellas tiene la misma probabilidad de
1
ocurrencia; por lo tanto P(A A)   0.100 (elegir la respuesta A de la primer pregunta y la
10
respuesta A de la segunda pregunta)
1
Ahora, con base en el diagrama de árbol, P(A)  (Pregunta 1) y
tenemos que,
2
1 1 1 1 1 1 1
P(A)  (Pregunta 2); por lo tanto,   . Con lo que P(A  B)  P(A)  P(B)   
5 2 5 10 2 5 10
IPN 154 CECYT-18

Si se eligen al azar dos sujetos de la siguiente tabla (sin reemplazo), calcule la
probabilidad de que la primera persona seleccionada tenga un resultado de prueba positivo y que la
segunda tenga un resultado de prueba negativo.
RESULTADOS DE EXÁMENES SOBRE EL CONSUMO DE DROGAS

¿Los sujetos realmente consumen drogas?
Sí No
Resultado de prueba positivo 119 24
(La prueba indica que las drogas sí están (Verdadero (Falso positivo)
presentes) positivo)
Resultado de prueba negativo 3 154
(La prueba indica que las drogas están ausentes) (Falso negativo) (Verdadero
negativo)
Para la resolución del problema consideremos los eventos:
A= “Resultado con prueba positivo”

B= “Resultado con prueba negativo”
Calculamos las probabilidades para cada uno de nuestros eventos, es decir,
143 157
P(A)   0.48 P(B)   0.52
300 299
En este caso argumentaremos que tenemos 143 Después de haber seleccionado a un sujeto con
sujetos que resultaron positivos y el número un resultado de prueba positivo, quedan 299
total de sujetos es de 300. sujetos en total, de los cuales, 157 tienen
resultados negativos de la prueba.
Por lo tanto, la probabilidad de que la primera persona seleccionada tenga un resultado de

prueba positivo y que la segunda tenga un resultado de prueba negativo queda expresado y
143 157
calculado como P(A  B)  P(A)  P(B)    0.25 (ya que son sin reemplazo)
300 299
IPN 155 CECYT-18

OBSERVACIONES:
Debemos ajustar la probabilidad del segundo suceso para reflejar el resultado del primer suceso
(la selección del segundo sujeto se realiza sin reemplazar al primero y, entonces, la segunda
probabilidad debe considerar que en la primera selección eliminó a un sujeto).
Consideremos, entonces, por ejemplo, jugar a la baraja en zacatecas y después, jugar a la baraja
en Aguascalientes son sucesos independientes porque el resultado de jugar en Zacatecas no
afecta el resultado de jugar en Aguascalientes.
El suceso de tomar el camión de pasajeros para ir a la escuela a tiempo son sucesos
dependientes, porque el resultado de que tome o no el camión de pasajeros afectará la
probabilidad de llegar o no a la escuela a tiempo.
DEFINICIÓN: dos eventos A y B son independientes cuando la ocurrencia de uno no

afecta la probabilidad de la ocurrencia del otro. (De manera similar, muchos otros
eventos son independientes si la ocurrencia de cualquiera de ellos no afecta las
probabilidades de ocurrencia de los demás). Si A y B no son independientes, se dice que
son dependientes y, por tanto,
P(A  B)  P(A)  P(B | A)
Si A y B son independientes, P(B | A)  P(B)
Sí P(AyB)=P(A)*P(B)
P(AyB)
¿A y B son
"Regla de la independientes? P(AyB)=P(A)*P(A|
multiplicación" B)
No "Calcule la
probabilidad de B
suponiendo que A ya
ocurrió"
IPN 156 CECYT-18

Consideremos una muestra de cinco calculadoras que incluye 3 que funcionan bien (B)
y dos que están defectuosas (D). Se van a seleccionar dos calculadoras al azar para realizar una
prueba de calidad. Calcule la probabilidad de que la primera calculadora funcione bien y que la
segunda calculadora también funcione bien.
a. Suponga que las dos selecciones aleatorias se realicen con reemplazo, es decir, una vez seleccionada
la primera calculadora se regresa a la muestra antes de tomar la siguiente.
b. Suponga que las dos elecciones aleatorias se realizan sin reemplazo, es decir, al sacar la primera
calculadora, no se regresa al lote antes de elegir la segunda calculadora.
Consideremos tres calculadoras que funcionan bien y dos que están defectuosas, es decir, BBB DD.
Eventos independientes (Con reemplazo) Eventos dependientes (Sin reemplazo)
B B B D D B B B D D
B B B D D B B D D
Declaramos los eventos
A= “La primera calculadora funciona bien”
B= “La segunda calculadora funciona bien”
a. Si elegimos las calculadoras con reemplazo, las dos selecciones son independientes, ya que el
segundo evento no se ve afectado por el primero y así, en cada selección hay tres calculadoras en
buen estado y dos defectuosas; por lo tanto, como todas las calculadoras tienen la misma probabilidad
3 3
de ser elegidas, tenemos que P(A  B )    0.36
5 5
b. Si elegimos las calculadoras sin reemplazo, las dos selecciones son dependientes, ya que el segundo
evento se ve afectado por el primero y, así, en la primera selección hay tres calculadoras en buen
estado y dos defectuosas, total cinco; después de elegir una calculadora que funciona bien en la
primera selección, quedan cuatro calculadoras, dos que funcionan bien y dos que no; por lo tanto,
3 2
P(A  B )    0.30
5 4
IPN 157 CECYT-18

Probabilidad condicional
La probabilidad condicional se usa cuando en el cálculo de un suceso se sabe que ha ocurrido otro
suceso con el cual se relaciona, es decir, los sucesos son dependientes.
Si consideramos dos sucesos A y B dependientes, tales que P(A)  0 , entonces, para expresar la
probabilidad de B dado que A ha ocurrido lo expresamos como P(B | A)  0 ; análogamente, si
P(B)  0 , entonces, para expresar la probabilidad de A dado que B ha ocurrido lo expresamos como
P(A | B)  0 .
Para ampliar un poco el concepto de probabilidad condicional considere la siguiente situación:
Se tienen 10 latas de refresco en un refrigerador, 7 normales y 3 de dieta. Se selecciona una lata al

7
azar; luego, la probabilidad de seleccionar una normal es de y la probabilidad de elegir una de
10
3
dieta es de . Suponga entonces que se elige una segunda lata sin regresar la primera, entonces, la
10
probabilidad de que al elegir la segunda lata sea dietética depende de si la primera lata haya sido o
no de dieta. Luego, la probabilidad de que la segunda lata sea dietética es:
2
a) si la primera lata elegida al azar fue dietética ya que sólo quedan dos latas dietéticas.
9
3
b) si la primera lata elegida al azar no fue dietética ya que quedan las tres latas dietéticas.
9
2 3
Así, la elección adecuada de la probabilidad o es probabilidad condicional ya que su valor se
9 9
encuentra condicionado de que el primer refresco seleccionado haya sido normal o dietético.
Probabilidad condicional. La probabilidad condicional de un evento B es la

probabilidad de que B ocurra cuando ya sabemos que otro evento A ha ocurrido.
Esta probabilidad se denota por P(B | A) y se lee: “la probabilidad de B dado A” y
puede calcularse dividiendo la probabilidad de que ocurran ambos eventos A y B,
entre la probabilidad del evento A, es decir:
P(A  B) P(A  B)
P(B | A)  con P(A)  0 y P(A | B)  con P(B)  0
P(A) P(B)
IPN 158 CECYT-18

Para determinar la probabilidad de un evento B sabiendo que ya ocurrió un evento A no se considera
como espacio muestral a S, sino que se considera al evento A (subconjunto de S) como el espacio
muestral reducido.
De un total de 20 músicos hay 7 que tocan la guitarra eléctrica, 11 que tocan piano y
3 que tocan ambos instrumentos. Si seleccionamos al azar a uno de estos músicos, ¿Cuál es la
probabilidad de que, al elegir a un músico al azar, éste toque la guitarra dado que el músico toca el
piano, es decir, P(G | P) ?
Denotamos los siguientes eventos:
G= “El músico toca guitarra”

P= “El músico toca el piano”
La probabilidad de que el músico toque guitarra y piano está

3
dada por P (GE  P )  ; además, la probabilidad de que la persona toque el piano está dada por
20
11 7
P(P )  y la probabilidad de que el músico toque la guitarra está dada por P(G )  .
20 20
Así, utilizando la regla de la probabilidad condicional tenemos que para calcular la probabilidad de
que, al elegir a un músico al azar, éste toque la guitarra dado que el músico toca el piano, está dada
3
por P (G | P )  P (G  P ) 20 3
   0.2727
P (P ) 11 11
20
Se lanza un dado. Encuentre la probabilidad de obtener:
a. El número 4 dado que se obtuvo un número par.
b. Un número impar dado que se obtuvo un número menor que 6.
Observe que en este caso nuestro espacio muestral está dado por S  {1,2,3, 4,5,6} .
a. Sabemos que se ha obtenido un número par, es decir, hay tres posibles resultados: 2, 4 o 6, de
1
los cuales, en sólo uno de ellos ocurre el 4. Por lo tanto P (4 | par )  .
3
b. Sabemos que se obtuvo un número menor que 6, por lo que hay 5 posibles resultados: 1, 2, 3,
3
4 y 5, de los cuales en tres de ellos obtenemos un número impar, es decir, P (impar | 6)  .
5
IPN 159 CECYT-18

Sean A, B y C tres eventos, tales que P(A)  0.2 , P(B)  0.5 y P(A  B)  0.1 .
Calcule: a. P(A | B) b. P(B | A) c. P (A | B c ) d. P (B | Ac )
P(A  B) 0.1 P(B  A) 0.1

a. P(A | B)    0.2 b. P(B | A)    0.5
P(B) 0.5 P(A) 0.2
P(A  B c ) P(B  Ac )
c. P (A | B )  d. P (B | A ) 
c c
P (B c ) P (Ac )
Para calcular la probabilidad condicional nos Para calcular la probabilidad condicional nos
apoyaremos de un diagrama de Venn. apoyaremos de un diagrama de Venn.
Observe que (A  B c ) está dada por: Observe que (B  Ac ) está dada por:
Luego, (A  B c )  A  B  A  (A  B ) y, Luego, (B  Ac )  B  A  B  (A  B ) y,
por tanto: por tanto:
P(A  Bc )  P(A)  P(A  B) P(B  Ac )  P(B)  P(A  B)

 0.2  0.1  0.1  0.5  0.1  0.4
Por otra parte, P(B c )  1  P(B )  1  0.5  0.5 Por otra parte,
P (A )  1  P (A)  1  0.2  0.8
c
Por lo tanto:
Por lo tanto:
P(A  B c ) 0.1
P(A | B c )    0.2 P(B  Ac ) 0.4
P(Bc ) 0.5 P(B | Ac )    0.5
P(Ac ) 0.8
IPN 160 CECYT-18

Considerando el ejemplo del consumo de drogas sintetizado en la siguiente tabla,
determine:
a. Si se elige al azar a una de las 300 personas de la prueba, calcule la probabilidad de que la persona
resulte positiva, dado que en realidad consumió drogas.
b. Si se elige al azar a una de las 300 personas de la prueba, calcule la probabilidad de que la persona
realmente haya consumido drogas, dado que tuvo un resultado de prueba positivo.
RESULTADOS DE EXÁMENES SOBRE EL CONSUMO DE DROGAS

¿Los sujetos realmente consumen drogas?
Sí No
Resultado de prueba positivo 119 24
(La prueba indica que las drogas sí están (Verdadero (Falso positivo)
presentes) positivo)
Resultado de prueba negativo 3 154
(La prueba indica que las drogas están ausentes) (Falso negativo) (Verdadero
negativo)
a. Determinamos la P(persona  positiva | consumió  drogas) “probabilidad de elegir a una

persona que resulte positiva, dado que realmente consumió drogas”. Si la persona consumió
drogas tenemos un total de 122 sujetos y de ahí buscamos la probabilidad de que uno de ellos
resulte positivo (119), de modo que, tenemos que la
119
P (persona  positiva | consumio  drogas )   0.975 .
122
Si realizamos el cálculo a través de la expresión para la probabilidad condicional, tenemos

que:
P(prueba  positiva | consumió  drogas ) 
P(prueba  positiva  consumió  drogas) 119 / 300

   0.975
P(consumió  drogas) 122 / 300
“El consumidor de droga tiene una probabilidad de 0.975 de obtener un resultado de prueba positivo”
IPN 161 CECYT-18

b. En este caso nos piden la probabilidad de que la persona realmente haya consumido drogas,
dado que tuvo un resultado de prueba positivo, es decir,
P(consumio  drogas | prueba  positiva |) . En este caso, si la persona tiene un resultado de
prueba positivo, tenemos, de acuerdo con la tabla anterior, 143 personas y, de ahí, buscamos la
probabilidad de que la persona realmente consumió drogas, es decir, 119 personas. Por lo tanto,
119
P(consumio  drogas | prueba  positiva )   0.832
143
Si realizamos el cálculo a través de la expresión para la probabilidad condicional, tenemos que:
P(consumio  drogas | prueba  positiva ) 
P(consumió  drogas  prueba  positiva) 119 / 300

   0.832
P(persona  positiva ) 143 / 300
“En algunos casos de prueba positiva, existe una probabilidad de 0.832 de que la persona realmente
haya consumido drogas”
Suponga que un lote de computadoras está compuesto por 256 equipos de las marcas
Soni, Del y HPe las cuales se ubicaron en los tres centros de cómputo del cecyt18. Si una persona
elige al azar una computadora Del, ¿Cuál es la probabilidad de que dicha computadora esté asignada
al centro de cómputo 2?
Centro de cómputo 1 Centro de cómputo 2 Centro de cómputo 3
Soni 30 45 23
Del 15 34 23
HPe 29 45 12
Para calcular la probabilidad de elegir una computadora Del y ésta esté asignada al centro de
cómputo 2 está dada por:
P(CC 2 | Del ) 
P(CC 2  Del ) 34 / 256

   0.4722
P(Del ) 72 / 256
IPN 162 CECYT-18

En una urna hay 15 canicas enumeradas del 1-15, de las cuales, cinco son rojas y 10
blancas, todas idénticas en forma y tamaño. Suponga que se seleccionan dos canicas al azar, sin
reemplazo.
a. Calcule la probabilidad de que las canicas extraídas sean blancas.
b. Calcule la probabilidad de que exactamente una de ellas sea roja, si extrae una tras otra, sin
reemplazo.
Sean los eventos:
A: “La primera canica extraída es blanca”
B: “La segunda canica extraída es blanca”
P(A  B)
a. Sabemos que P(B | A)  , entonces, despejando tenemos que, P(A  B)  P(A)  P(B | A)
P(A)
.
10
Así, tenemos en la urna en total 15 canicas, de las cuales, 10 son blancas, por lo tanto, P (A)  .
15
Cuando calculamos la probabilidad del evento B, restringimos la extracción a una bola blanca, por
lo que en la urna quedan sólo 14 canicas, de las cuales, nueve son blancas. Entonces la probabilidad
9
para extraer una segunda canica blanca está dada por P (B | A)  .
14
Finalmente, calculamos la probabilidad de las dos canicas extraídas sean blancas, está dada por
 10   9  90
P(A  B )  P(A)  P(B | A)        0.4285
 15   14  210
b. Al sacar dos canicas, una tras otra, sin repetición, puede ocurrir exactamente una roja de dos
formas:
Cuando la primera canica es roja y la segunda no lo es.
Cuando la primera canica no es roja y la segunda sí lo es.
Sean los eventos: A1: “La primera canica extraída es roja” y, B1: “La segunda canica
 5   10  50
extraída no es roja”, entonces, P(A1  B1)  P(A1)  P(B1 | A1)       0.2380
 15   14  210
Sean los eventos: A2: “La primera canica extraída no es roja” y, B2: “La segunda canica
 10   5  50
extraída es roja”, entonces, P(A2  B 2)  P(A2)  P(B 2 | A2)       0.2380
 15   14  210
Finalmente, la probabilidad buscada es la unión de los eventos mutuamente excluyentes

(A1  B1)y(A2  B2) . Luego, la probabilidad de que una de ellas sea roja, si se extrae una tras otra,
50 50
sin reemplazo está dada por P (A1  B1)  (A2  B 2)    0.4761
210 210
IPN 163 CECYT-18

ESTANDARÍZATE 11
1. En una encuesta acerca de qué periódico lee 2. En el Cecyt-18 el 50% de los estudiantes
la gente se obtuvieron los siguientes datos: el tienen el cabello negro, el 35% de los
30% de la gente lee La Jornada, el 20% lee El estudiantes tiene los ojos cafés y 15% tiene los
Universal y el 4% lee ambos. a. Si se selecciona ojos cafés y cabello negro. Si se elige un alumno
un lector que lee El Universal, ¿Cuál es la al azar y este:
probabilidad de que lea La Jornada? a. tiene cabello negro, ¿Cuál es la probabilidad
de que tenga los ojos cafés?
b. Si se selecciona un lector que lee La Jornada,

¿Cuál es la probabilidad de que lea El b. tiene los ojos cafés, ¿Cuál es la probabilidad
Universal? de que tenga el pelo negro?
3. Los siguientes datos sobre 100 senadores del 108 congreso de Estados Unidos
Republicano Demócrata Independiente
Hombre 46 39 1
Mujer 5 9 0
a) Si seleccionamos al azar a un senador, ¿Cuál es la probabilidad de elegir a un republicano, dado

que seleccionamos a un hombre?
b) Si seleccionamos al azar a un senador, ¿Cuál es la probabilidad de elegir a una mujer, dado que
seleccionamos a un individuo independiente?
c) Si seleccionamos al azar a un senador, ¿Cuál es la probabilidad de elegir a un demócrata o un

independiente, dado que seleccionamos a un hombre?
4. En un salón de clases, el 60% son hombres y 5. En una escuela de 1000 estudiantes, 200
el 40% son mujeres. El 25% de los hombres son juegan algun deporte, 100 están en una banda,
menores de 15 años al igual que el 50% de las 50 juegan algú deporte y están en la banda y
mujeres. ¿Cuál es la probabilidad de que al 750 no participan de ninguna actividad. ¿Cuál
elegir un estudiante al azar este sea hombre es la probabilidad de que al elegir a un
dado que es menor de 15 años? estudiante de forma aleatoria, este juegue
algún deporte dado que, ya pertenece a la
banda?
IPN 164 CECYT-18

6. Un estudio desarrollado con 30 personas 7. El coordinador de vuelos de un aeropuerto
sobre su preferencia por una mascota, arroja debe coordinar la salida de 30 vuelos, donde 12
los siguientes datos: 16 personas prefieren los deben viajar a Zacatecas, 10 a CDMX y 8 a
perros, 12 prefieren los gatos y 7 prefieren los Monterrey. Los aviones se clasifican en bueno
peces. Además, 5 personas prefieren los perros y excelente y, hay 10 y 20 respectivamente. El
y los gatos, 3 prefieren los perros y los peces, 2 coordinador los distribuye de la siguiente
prefieren los gatos y los peces y 2 personas manera:
prefieren las tres mascotas. Zac CDMX MTY
a) Se elige una persona al azar, ¿Cuál es la Bueno 2 4 4
probabilidad de que esa persona prefiera Excelente 10 6 4
exactamente una mascota? Si un piloto que maneja un avión en excelente
b) ¿Cuál es la probabilidad de que una persona estado es entrevistado,
prefiera un gato dado que ya prefirió a un a) ¿Cuál es la probabilidad de que este viaje a
perro? Zacatecas?
c) ¿Cuál es la probabilidad de que una persona b) ¿Cuál es la probabilidad de que vaya a
prefiera únicamente a los perros? Monterrey dado que no es excelente?
c) ¿Cuál es la probabilidad de que no vaya a
las CDMX?
8. Un estudio se desarrolló con 130 consumidores de leche, a los cuales se les preguntó su
preferencia por la leche entera, semi-entera o light. Los resultados se muestran a continuación.
Light Semi-entera Entera

Mujer 50 15 5
Hombre 20 30 10
a) ¿Cuál es la probabilidad de que al elegir a un participante al azar, este sea mujer?
b) ¿Cuál es la probabilidad de que la persona consuma leche entera?
c) ¿Cuál es la probabilidad de que la persona consuma leche light o semi-entera?
d) ¿Cuál es la probabiliad de que una persona consuma leche semi-entera dado que la persona
es mujer?
e) ¿Cuál es la probabilidad de que un bebedor de leche sea mujer, dado que la persona consume
leche semi-entera?
9. Considere el experimento de lanzar dos 10. En la sala de urgencias de un hospital, el
dados. 55% de los pacientes son mujeres. De los
a) ¿Cuál es la probabilidad de que uno y sólo hombres el 38% están con respirador artificial
uno de los dados caiga con el número tres hacia y de las mujeres, el 25% están con repirador
arriba dado que la suma de los números artificial. Un médico que ingresa a la sala de
obtenidos es mayor a 6? urgencias selecciona a un paciente al azar para
b) ¿Cuál es la probabilidad de uno y sólo uno tomarlo como su caso médico.
de los dados caiga con el número tres hacia a) Si el paciente resulta estár con respirador
arriba y que la suma de los números obtenidos artificial, ¿Cuál es la probabilidad de que sea
sea mayor a 6? mujer?
b) Cuál es la probabilidad de que el paciente
seleccionado sea hombre y no use respirador?
IPN 165 CECYT-18

El teorema de Bayes
El teorema de Bayes tiene aplicaciones en la teoría de decisiones y en la inferencia estadística que

puede encerrar áreas como la tecnología, negocios, medicina entre otras; este teorema se debe al
matemático Británico Thomas Bayes (1702-1761).
El teorema de Bayes es una forma más general de calcular la probabilidad condicional, en la cual,
deseamos calcular la probabilidad de que ocurra un evento Bi , dado que un evento A ha ocurrido.
Para introducirnos al teorema de Bayes, recordemos que la probabilidad condicional de un evento

P(A  B)
A, dado que ya ocurrió el evento B, está dada por P(A | B)  , P(B)  0 y el teorema de
P(B)
la probabilidad total que analizaremos a continuación.
Enunciamos así, el teorema de la probabilidad total.
Teorema de la probabilidad total. Sean los eventos B1 , B2 , B3 ,..., Bk una partición

exhaustiva y mutuamente excluyente del espacio muestral S, de tal forma que
P(Bi )  0 para i  1, 2, 3,..., k , entonces para cualquier evento A en S,
k
P(A)  P(B )P(A | B )

i 1
i i
En un diagrama de Venn, la regla de la probailidad total se ilustra de la siguiente forma: dado un

espacio muestral S, realizamos en él una partición mutuamente excluyente y exhaustiva con eventos
B1 , B2 , B3 ,..., Bk , es decir, los eventos no tienen intersección entre sí y formando el espacio muestral
S.
Luego, introducimos en el espacio muestral un evento A, el

cual tiene intersección con todos o algunos de los Bi .
Por tanto, el evento A se puede obtener de las intersecciones

de A con cada uno de los Bi con los que tiene intersección.
IPN 166 CECYT-18

Si observamos el diagrama, observemos que A se puede obtener de la suma de las intersecciones de
A con los Bi con los que tiene intersección, es decir,
A  (A  B2 )  (A  B3 )  (A  B4 )  (A  B5 )  (A  B6 )  (A  B7 )  (A  B8 ) , que es lo mismo, el
k
evento A   (A  B ) .
i 1
i
Con el diagrama de árbol donde la probabilidad

del resultado final está dada por la suma de los
productos de las probabilidades correspondientes
a cada rama, explica de forma gráfica el cálculo
anterior.
Así, el teorema de Bayes utiliza la definición de

probabilidad condicional y el teorema de la probabilidad total.
Probabilidad condicional Probabilidad total

P(A  B) k k
P(B | A) 
P(A)
, P(A)  0 P(A)  
i 1
P(B )  P(A | B )
P(Bi  A) 
i 1
i i
Teorema de Bayes
P(Br )  P(A | Br )
P(Br | A)  k
 P(B )  P(A | B )
i 1
i i
NOTA: observe que la expresión en el numerador es la probabilidad de alcanzar A vía la r-ésima

rama del árbol y la expresión del denominador es la suma de las probabilidades de alcanzar A vía
las n-ésimas ramas del árbol.
Una empresa recibe monitores para computadora de tres proveedores diferentes, 55%
del proveedor B1 , 35% del proveedor B2 y 10% del proveedor B3 ; además, el 90% de los monitores
del proveedor B1 , 80% de los monitores del proveedor B2 y 78% de los monitores del proveedor B3
funcionan correctamente.
Ahora, supongamos que estamos interesados en saber la probabilidad de que algún monitor que se
recibe en la empresa funcione correctamente.
IPN 167 CECYT-18

Sean los eventos:
A: “El monitor funciona correctamente”
B1 : “El monitor proviene del proveedor B1 ”
Como A denota el correcto funcionamiento de un monitor recibido por alguno de los tres proveedores
y así mismo, B1 , B2 , B3 son los eventos de que el monitor que funciona correctamente proviene de
alguno de los tres proveedores, tenemos entonces que A  (A  B1 )  (A  B2 )  (A  B3 ) donde
B1 , B2 , B3 son eventos mutuamente excluyentes, así como (A  B1 ),(A  B2 ),(A  B3 ) también son
mutuamente excluyentes.
Por lo tanto P(A)  P(A  B1 )  P(A  B2 )  P(A  B3 ) y como hemos dicho anteriormente:
Si A y B son eventos cualesquiera de S, entonces se

cumple que:
1. P(A  B)  P(A)  P(B | A) si P(A)  0

2. P(A  B)  P(B)  P(A | B) si P(B)  0
Entonces,
P(A)  P(A  B1 )  P(A  B2 )  P(A  B3 )

 P(B1 )P(A | B1 )  P(B2 )P(A | B2 )  P(B3 )P(A | B3 )
Si realizamos un diagrama de árbol para expresar las

probabilidades, tenemos el siguiente diagrama:
Con esta expresión, tenemos que la probabilidad de elegir al azar un monitor y éste funcione
correctamente está dada por:
P(A)  P(B1 )P(A | B1 )  P(B2 )P(A | B2 )  P(B3 )P(A | B3 )

 (0.55)(0.90)  (0.35)(0.80)  (0.1)(0.78)
 0.853
Observe pues, que, la probabilidad de que el monitor funcione correctamente está dada por la suma
de los productos de las probabilidades correspondientes a cada rama del árbol.
IPN 168 CECYT-18

Supongamos que la probabilidad de que un hombre fume es de 0.6 y la de que una
mujer sea fumadora es de 0.3. En la empresa “Cableados de Zacatecas”, el 75% del personal son
hombres y el 25% son mujeres. Si se selecciona al azar a un trabajador, ¿Cuál es la probabilidad de
que esta persona fume?
Luego, la probabilidad de que la persona elegida fume es igual a la probabilidad de que fume y sea
hombre más la probabilidad de que fume y sea mujer. Entonces, denotamos los siguientes sucesos:
H: “El sujeto seleccionado es hombre”
F: “El sujeto seleccionado es fumador”
Así, la probabilidad de seleccionar a un trabajador al azar y éste fume está dada por la probabilidad
de que el sujeto seleccionado se hombre y además fume, más la probabilidad de que, el sujeto
seleccionado sea mujer y además fume, es decir, P(F )  P(H  F )  P(H c  F ') .
Observemos las probabilidades a través de un diagrama de Venn y un diagrama de árbol como se

muestra a continuación:
0.6 (F)
0.75 (H)
0.4 (F')
0.3 (F)
0.25 (H')
0.7 (F')
Luego, la probabilidad de seleccionar a un trabajador y éste sea fumador está dada por
P(F )  P(H  F )  P(H c  F ')
 P(H )P(F | H )  P(H c )P(F | H c )  (0.75)(0.6)  (0.25)(0.3)  0.525
El teorema de Bayes se define como una probabilidad condicional basada en el resultado de un hecho
ya ocurrido para describir otra propiedad específica, es decir, que se tiene nueva información con la
cual se determina si una probabilidad se debe a una causa específica.
La expresión que nos permite aplicar la regla de Bayes en su forma simple está dada por
P (A)  P (B | A)
P (A | B )  que ilustramos con los ejemplos siguientes.
P (B )
Un primer acercamiento a la regla de Bayes es el siguiente ejemplo:
IPN 169 CECYT-18

Una fábrica de neumáticos, dispone de dos máquinas A y B que producen el 70% y
el 30% de toda la producción. El porcentaje de neumáticos defectuosos que producen cada máquina
es de 3% y 11% respectivamente. Si se selecciona al azar un neumático y éste es defectuoso, calcular
la probabilidad de que haya sido fabricado por la máquina A.
Aplicando la regla de Bayes, tenemos que se trata de una probabilidad condicional, ya que, nos
piden la probabilidad de seleccionar un neumático de forma aleatoria y este haya sido
producido por la máquina A dado que este fue defectuoso, es decir, P (A | B )  P(A)  P(B | A) .
P (B )
Nos apoyaremos de un diagrama de árbol para ilustrar la solución del problema.
Ilustramos con un diagrama de árbol las respectivas probabilidades:
Aplicando la regla de Bayes haciendo uso del

diagrama de árbol, tenemos que:
P(A)  P(D | A)
0.03 (D) P(A | D) 
P(D)
0.7 (A)
(0.70)(0.03)
0.97 (D')   0.3888
(0.70)(0.03)  (0.3)(0.11)
0.11 (D)
0.3 (B) Recuerde que en el denominador es la
0.89 (D') probabilidad de que el neumático esté
defectuoso lo cual, nos lleva a dos ramas en las
cuales se tiene el neumático defectuoso que
provienen de la máquina A y de la máquina B.
Teorema de Bayes. Sean los eventos B1 , B2 , B3 ,..., Bk una partición exhaustiva y

mutuamente excluyente del espacio muestral S, de tal forma que P(Bi )  0 para
i  1, 2, 3,..., k ; entonces, para cualquier evento A en S tal que P(A)  0 se tiene que:
P(Br  A) P(Br )  P(A | Br )

P(Br | A)   para r  1, 2, 3,..., k
k k
 P(B  A)  P(B )  P(A | B )

i 1
i
i 1
i i
IPN 170 CECYT-18

Tres urnas contienen bolas blancas y negras. La composición de cada una de ellas es
la siguiente: U1  {5B,2N },U2  {2B, 2N },U 3  {4B, 3N } . Se elige al azar una de las urnas y se extrae
una bola que resulta ser negra. ¿Cuál es la urna con mayor probabilidad de haber sido elegida?
Observemos que U 1 ,U 2 ,U 3 representan una partición de nuestro espacio muestral y como la urna se
1 1 1
elige al azar, entonces, P(U1 )  , P (U 2 )  y P (U 3 )  .
3 3 3
Sea el evento N: “La bola extraída es negra”.
Nos piden calcular P (U i | N ) para saber cuál de las urnas ha originado más probablemente la
extracción de la bola negra. Luego, aplicaremos el teorema de Bayes:
P(Br )  P(A | Br )
P(Br | A)  para cada una de las urnas como se muestra a continuación:
k
 P(B )  P(A | B )
i 1
i i
1 2
  
P(U 1 )  P(N | U 1 ) 37 
P(U 1 | N )    0.23
P(U 1 )  P(N | U 1 )  P(U 2 )  P(N | U 2 )  P(U 3 )  P(N | U 3 )  1   2   1   2   1   3 
          
37  3 4 37 
12
  
P(U 2 )  P(N | U 2 ) 34
P(U 2 | N )    0.42
          
3 7   3 4 3  7 
13
  
P(U 3 )  P(N | U 3 ) 37
P(U 3 | N )    0.35

         
37 34 37 
Por lo tanto, la segunda urna es la que con mayor probabilidad dio origen a extraer una bola negra.
Otra manera sencilla de aplicar el teorema de Bayes es haciendo uso de los diagramas de árbol. Para
ello, revisemos el siguiente ejemplo:
IPN 171 CECYT-18

Una máquina M 1 produce el 60% de los tornillos en la producción total de una fábrica
y una máquina M 2 produce el 40% de los tornillos restantes. Se sabe que la máquina M 1 produce
un 2% de tornillos defectuosos mientras que la máquina M 2 produce un 3% de tornillos defectuosos.
Determine lo siguiente:
a) Si se elige un tornillo al azar, ¿Cuál es la probabilidad de que sea defectuoso?
b) Si se elige un tornillo al azar y este salió defectuoso, ¿Cuál es la probabilidad de que haya sido
producido por la máquina M 1 ?
c) Si el tornillo no es defectuoso, ¿Cuál es la probabilidad de que haya sido producido por la máquina
M2?
Para responder a estas preguntas, vamos a construir un diagrama de árbol asignando las
probabilidades correspondientes para posteriormente aplicar el teorema de Bayes haciendo uso de los
siguientes eventos:
M 1 : “el tornillo fue producido por la máquina 1”
M 2 : “El tornillo fue producido por la máquina 2”
D: “El tornillo está defectuoso”
ND: “El tornillo no está defectuoso”
a) La probabilidad de elegir un tornillo defectuoso en general, está dada por

P (D )  P (M 1 )P (D | M 1 )  P (M 2 )P (D | M 2 )  (0.6)(0.02)  (0.4)(0.03)  0.024
b) Si se eligió un tornillo defectuoso, para calcular la probabilidad de que haya venido de la máquina
M1 , considere el uso del teorema de Bayes, es decir,
P(M1 )P(D | M1 ) (0.6)(0.02)
P(M1 | D)    0.5
P(M1 )P(D | M1 )  P(M 2 )P(D | M 2 ) (0.6)(0.02)  (0.4)(0.03)
c) Si se eligió un tornillo no defectuoso, para calcular la probabilidad de que haya venido de la

máquina M2, considere el uso del teorema de Bayes, es decir,
P(M 2 )P(ND | M 2 ) (0.4)(0.97)
P(M 2 | ND)    0.40
P(M1 )P(ND | M1 )  P(M 2 )P(ND | M 2 ) (0.6)(0.98)  (0.4)(0.97)
IPN 172 CECYT-18

Una prueba detecta la presencia de plomo en una muestra de agua con una
probabilidad de 0.9, en caso de haberlo. Si no lo hay, detecta la ausencia con una probabilidad de
0.8. Sabiendo que la probabilidad de que una muestra de agua contenga plomo es de 0.2, calcular la
probabilidad de que:
a) Realmente haya plomo cuando la prueba ha dado positiva.
b) Realmente haya plomo cuando la prueba ha dado negativa.
c) Haya plomo y además la prueba salga positiva.
d) Haya plomo en el agua o la prueba de positiva.
Consideremos los sucesos:
A: “La muestra contiene plomo”
B: “La muestra no contiene plomo”
El enunciado menciona que la probabilidad de que la muestra

contenga plomo es de 0.2, es decir, P(A)  0.2 y por tanto la probabilidad de que la muestra no
contenga plomo es de 0.8, el suceso complementario, esto es, P(B)  1  P(A)  1  0.2  0.8
Consideramos también los sucesos:
P  : La prueba detecta presencia de plomo.
P  : La prueba no detecta presencia de plomo.
De acuerdo con el enunciado, la prueba detecta la presencia de plomo dado que lo hay con una
probabilidad de P (P  | A)  0.9 y detecta la ausencia de plomo en el agua dado que no lo hay con
una probabilidad dada por P (P  | B )  0.8 . Entonces:
a) Para saber la probabilidad de que haya plomo en el agua dado que la prueba dio positiva estará
P(A)  P(P  | A) (0.2)(0.9)
dado por P(A | P )   0.53


P(A)  P(P | A)  P(B)  P(P | B ) (0.2)(0.9)  (0.8)(0.2)
 
b) Para saber la probabilidad de que realmente haya plomo dado que la prueba ha dado negativa
P(A)  P(P  | A) (0.2)(0.1)
estará dada por P(A | P )   0.030


P(A)  P(P | A)  P(B)  P(P | B) (0.2)(0.1)  (0.8)(0.8)
 
c) Para calcular la probabilidad de que haya plomo en la muestra y además la prueba salga positiva
estará dada por P (A  P  )  P (A)  P (P  | A)  (0.2)(0.9)  0.18
IPN 173 CECYT-18

d) Para calcular la probabilidad de que haya plomo en el agua o la prueba sea positiva estará dada
por P (A  P  )  P (A)  P (P  )  P (A  P  )  0.2  0.34  0.18  0.36
Señale que para calcular el valor de P(P  ) , observemos en el diagrama de árbol que será la suma de
los productos de los casos en que se da un resultado de prueba positivo por cada uno de los casos en
que la muestra contiene o no plomo, es decir, P (P  )  (0.9)(0.2)  (0.2)(0.8)  0.34
La enfermera del doctor Juárez es una persona en la que no se puede confiar, pues
cuando el doctor no está, la probabilidad de que no le inyecte un suero a un paciente es de 0.6. Se
sabe que si a un enfermo se le inyecta el suero tiene la misma probabilidad de mejorar que de
empeorar, pero si no se le inyecta, la probabilidad de que mejore es de 0.20. Al regreso del doctor
Juárez, encuentra que un enfermo ha empeorado. ¿Cuál es la probabilidad de que la enfermera haya
olvidado poner el suero al paciente?
Sean los sucesos:
A: “La enfermera le pone el suero al paciente”
B: “La enfermera no le pone el suero al paciente”
C: “El paciente empeora”
D: “El paciente no empeora”
El enunciado menciona que la P(B)  0.6 y entonces por el

complemento la P(A)  1  0.6  0.4
Menciona que si se le inyecta el suero a un paciente tiene la misma probabilidad de mejorar que de
empeorar, es decir, P(C | A)  P(D | A) y que, si no se le pone el suero, la probabilidad de mejorar
está dada por P(D | B)  0.20
Observe, además que, los sucesos C y D forman un sistema completo, así como sus intersecciones con
A y B forman también un sistema completo para los espacios probabilísticos condicionados por A y
B, luego, P(C | A)  P(D | A)  1 ; además, sabemos que P(C | A)  P(D | A) de donde
P(C | A)  P(D | A)  0.5 ; por otra parte, P(C | B)  P(D | B)  1 de donde 1  P(C | B)  0.20
encontrando que P(C | B)  1  0.20  0.8
Para encontrar la probabilidad de que la enfermera haya olvidado poner el suero al paciente dado
P (B )  P (C | B ) (0.6)(0.8)
que empeoró tenemos que P(B | C )    0.7058
P (A)  P (C | A)  P(B )  P (C | B ) (0.4)(0.5)  (0.6)(0.8)
Por lo tanto, el 70.58% de las veces un paciente empeora por culpa de la enfermera.
IPN 174 CECYT-18

ESTANDARÍZATE 12
1. Tres maquinas: A, B y C producen el 40%, 25% y el 35% de los telefonos de la empresa Telquel
respectivamente. Se ha detectado que 6%, 2% y 4% respectivamente de los teléfonos producidos por
las máquinas están defectuosos.
a) Si se elige al azar un teléfono, ¿Cuál es la probabilidad de que sea defectuoso?
b) Si se eligió al azar un teléfono defectuoso, ¿Cuál es la probabilidad de que haya sido ensamblado
por la máquina A?
c) Si se eligió al azar un telefono y no está dectuoso, ¿Cuál es la probabilidad de que haya sido
ensamblado por la máquina B?
2. En un hospital de especialidades médicas, la Dra. Aylin atiende al 50% de los pacientes, el Dr.
Badillo atiende al 30% de los pacientes y el Dr. Campos atiende al 20% de los pacientes. Se sabe
tambien que, la Dra. Aylin le pide examenes sanguíneos al 10% de sus pacientes, el Dr. Badillo le
pide examenes sanguíneos al 15% de sus pacientes y el Dr. Campos le pide examenes sanguíneos al
20% de sus pacientes.
a) Encuentra la probabilidad de que a un paciente elegido de forma aleatoria se le hayan pedido

examenes sanguíneos.
b) ¿Cuál es la probabilidad de que la Dra. Aylin haya tratado a un paciente si a este se le pidieron
examenes sanguíneos?
c) ¿Cuál es la probabilidad de que el Dr. Badillo haya tratado a un paciente si a este no se le pidieron
examenes sanguíneos?
3. Use la información del diagrama de árbol siguiente para calcular:
a) P(A)
b) P(B | A)
c) P(B | A')
IPN 175 CECYT-18

4. Cuatro técnicos efectuan reparaciones regularmente cuando ocurren fallas en la línea de producción
automatizada. Valeria, quien atiende el 25% de las fallas hace una reparación incompleta 1 vez en
15; Carlos, quien atiende el 60% de las fallas hace una reparación incompleta 1 vez en 10; Daniel,
quien atiende el 10% de las fallas hace una reparación incompleta 1 vez en 10 y Frida, quien atiende
el 5% de las fallas hace una reparación incompleta 1 vez en 15. Se ha diagnosticado una reparación
inicial incompleta, encuentre la probabilidad de que:
a) Frida haya realizado la reparación inicial.
b) Daniel haya realizado la reparación inicial.
5. Una empresa de colocaciones ha realizado un estudio sobre los trabajos solicitados por personas
de entre 18-35 años, de entre 36-55 años y más de 56 años. El informe que desarrolla la empresa
clasifica a estas personas como aptas o no aptas para el trabajo solicitado, y de los datos que se
tienen se observa que sólo el 20% son aptos para el trabajo solicitado, de los cuales, un 17% tienen
más de 56 años, un 33% tienen entre 36-55 años y un 50% tienen entre 18-35 años. Respecto a los
no aptos que solicitan un empleo, un 45% tienen más de 56 años, un 45% tienen entre 36-55 años y
un 10% tienen entre 18-35 años.
a) ¿Qué porcentaje de estas personas se encuentran entre 18-35 años y están calificados para el
trabajo solicitado?
b) ¿Cuál es la probabilidad de que una de estas personas que solicitan trabajo tengan entre 36-55
años?
c) De las personas de más de 56 años que solicitaron un trabajo, ¿Qué porcentaje no son aptos para
los puestos?
6. En un sistema de alarma, la probabilidad de que esta funcione habiendo peligro es de 0.96. La

probabilidad de que funcione por error sin haber peligro es de 0.02. Si la probabilidad de que haya
peligro es de 0.1,
a) Encuentre el porcentaje de veces que habiendo funcionado la alarma no haya peligro.
b) Encuentre la probabilidad de que haya peligro y la alarma funcione.
c) Encuentre la probabilidad de que no habiendo funcionado la alarma haya peligro.
d) ¿Cuál es la probabilidad de que la alarma funcione?
IPN 176 CECYT-18

7. Se tienen tres urnas que contienen cartas marcadas con los números 1, 2 y 3. La primer urna tiene
3, 2 y 6 cartas con los número márcados respectivamente; la segunda urna contiene 5, 1 y 3 cartas
con los números marcados respectivamente y la tercer urna contiene 2, 5 y 1 cartas con los números
marcados respectivamente.
a) Si se elige al azar una de las urnas y se extrae una carta que resulta estar marcada con el número
3, ¿Cuál es la probabilidad de que haya salido de la urna 2?
b) ¿Cuál es la probabilidad de que si se elige al azar una urna y se extrae una carta esté marcada
con el número 1?
8. En un acuario se tienen 2 especies de peces. El 35% de los peces son de la especie azul y el 65%
son de la especie roja. De la especie azul, el 40% son machos mientras que, de la especie roja el 60%
son hembras. Si se selecciona un pez al azar,
a) y resulta ser hembra, ¿Cuál es la probabilidad de que sea de la especie azul?
b) y resulta que es macho, ¿Cuál es la probabilidad de que sea de la especie azul?
9. Una empresa de bicicletas fabrica tres tipos de bicicletas: principiantes, intermedios y expertos
con una proporción de 40%, 50% y 10% respectivamente. La probabilidad de que una bicicleta
principiante se averíe durante el pimer año es de 0.08, la de que se averíe una bicicleta intermedia es
de 0.05 y la de tipo expertos con 0.10.
a) ¿Cuál es la probabilidad de que una bicicleta producida por esa empresa sufra una avería antes
del primer año de uso?
10. En el Municipio de Morelos, se tienen los siguiente grupos de acuerdo con su respectiva edad:
Niños, Adultos y Ancianos. Se conoce también la proporcion que representa cada uno de estos
grupos en la población y se conoce también la incidencia de la tos en cada uno de los grupos como
se muestra a continuación:
P(N )  0.3 P(T | N )  0.45

P(Ad )  0.6 y, además, P(T | Ad )  0.30
P(An)  0.1 P(T | An)  0.65
a) Entre las personas que tienen tos, ¿Cuál es la proporción de ancianos?

b) Entre las personas que tienen tos, ¿Cuál es la proporción de adultos?
c) Entre las personas que tienen tos, ¿Cuál es la proporción de niños?
IPN 177 CECYT-18

3. DISTRIBUCIONES DE PROBABILIDAD
Distribuciones de probabilidad discreta

Una distribución de probabilidad nos sirve para describir lo que posiblemente sucederá en un
experimento aleatorio y frecuentemente se presentan por medio de una gráfica, una tabla o una
fórmula.
Para comprender lo que es una distribución de probabilidad, primero debemos comprender el

concepto de variable aleatoria y saber diferenciar entre una variable aleatoria discreta y una variable
aleatoria continua. La combinación de métodos descriptivos y probabilidades para formar un modelo
teórico de comportamiento lo podemos apreciar en el siguiente diagrama.
Para comenzar con nuestro estudio analicemos las siguientes definiciones:
Variable aleatoria Es aquella (casi siempre se representa por x ) que toma un valor
numérico único para cada uno de los resultados del espacio muestral de
un experimento de probabilidad.
Distribución de Muestra los posibles resultados de un experimento y la probabilidad de
probabilidad que cada uno se presente.
Variable aleatoria Adopta sólo cierto número de valores separados, es decir, hay huecos
discreta entre uno y otro y algunas veces acepta valores fraccionarios o decimales.
Por ejemplo, un contador de personas que suben a un transporte público.
Variable aleatoria Tiene un número infinito de valores y, esos valores pueden asociarse con
continua mediciones de una escala continua, de manera que, no existan huecos o
interrupciones. Por ejemplo, un velocímetro
IPN 178 CECYT-18

¿Cómo construir una distribución de probabilidad?
Suponga que nos interesa saber el número de águilas que podemos obtener al lanzar una moneda 3
veces. ¿Cuál sería la distribución de probabilidad del número de águilas?
Si lanzamos una moneda 3 veces, entonces, los resultados posibles serán 8, como se ilustra en la
siguiente tabla:
Resultado Lanzamiento de la moneda Número de

posible Primer Segundo Tercer Águilas obtenidas
lanzamiento lanzamiento lanzamiento
1 S S S 0
2 S S A 1
3 S A S 1
4 S A A 2
5 A S S 1
6 A S A 2
7 A A S 2
8 A A A 3
Analizando la tabla anterior, tenemos que el resultado “cero águilas” ocurre sólo una vez; el resultado
una águila ocurre 3 veces, el resultado dos águilas ocurre tres veces y el resultado tres águilas ocurre
sólo una vez. Luego, con base en estos resultados podemos construir una distribución de probabilidad
de los eventos relativos a cero, una, dos y tres águilas en tres lanzamientos de una moneda.
Número Probabilidad del Luego, la gráfica de la distribución de

de resultado probabilidad correspondiente al número de
águilas, x P(x ) águilas que resultan de lanzar una moneda en
0 1 tres ocasiones.
 0.125
8
1 3
 0.375
8
2 3
 0.375
8
3 1
 0.125
8
Total 1.000
IPN 179 CECYT-18

Considere el lanzamiento de dos dados numerados del 1 al 6 y como distribución de
probabilidad a la variable suma ( x ). Luego, ¿Cuál sería la distribución de probabilidad para la suma
de los números obtenidos en el lanzamiento de los dos dados?
Considere que, si lanzamos dos dados, el espacio muestra S estará compuesto por 36 formas diferentes
en las cuales, pueden caer los dados. Si registramos las posibles sumas al lanzar los dos dados,
tendremos que:
Valor de la suma Número de veces que se Probabilidad del resultado

obtenida ( x ) obtiene el valor de la P(x )
suma
2 1 1 / 36  0.0277
3 2 2 / 36  0.0555
4 3 3 / 36  0.0833
5 4 4 / 36  0.1111
6 5 5 / 36  0.1388
7 6 6 / 36  0.1666
8 5 5 / 36  0.1388
9 4 4 / 36  0.1111
10 3 3 / 36  0.0833
11 2 2 / 36  0.0555
12 1 1 / 36  0.0277
Total 36 1.000
+ 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
IPN 180 CECYT-18

Requisitos para una distribución de probabilidad discreta
 P(x)  1 donde x asume todos los valores posibles. La suma de todas las
probabilidades debe ser 1.

0  P(x)  1 para cada valor individual de x . Es decir, cada valor de probabilidad
debe ubicarse entre cero y uno.
Observe que, el primer requisito surge del hecho de que la variable aleatoria x representa todos los
eventos posibles en el espacio muestral completo, de modo que, tenemos la certeza (con probabilidad
1) de que uno de los eventos va a ocurrir.
La siguiente tabla con probabilidades de una variable aleatoria, ¿describe una

distribución de probabilidad?
Probabilidades de una variable aleatoria
x P(x ) Recuerde que para ser una distribucion de

probabilidad, P(x ) debe satisfacer los dos
0 0.2 requisitos anteriores, es decir,
1 0.5
 P(x)  0.2  0.5  0.4  0.2  1.30 lo que
2 0.4 prueba que  P(x )  1 y por lo tanto no es
3 0.2 una distribución de probabilidad.
x
¿ P (x )  , x  0,1, 2, 3, 4 determina una distribución de probabilidad?
10
x x Recuerde que para ser una distribucion de
P (x ) 
10 probabilidad, P(x ) debe satisfacer los dos
0 0 requisitos anteriores, es decir,
P (0) 
10
1 1 0 1 2 3 4 10
P (1) 
10 1.  P(x )  10  10  10  10  10  10  1
lo que prueba que  P(x )  1 .
2 2
P (2) 
10
3 3 2. Observe que cada una de las probabilidades
P (3) 
10 toma valores entre cero y uno.
4 4 x
P (4)  Por lo tanto, P (x )  es una distribución de
10 10
probabilidad.
IPN 181 CECYT-18

Funcion de distribución acumulada
Definición. La función de distribución acumulada (fda) F (x ) para una variable

aleatoria X se define por F (x )  P(X  x ) donde x es cualquier número real, es decir,
especifica la probabilidad de que una variable aleatoria sea menor o igual que un valor
dado. Si X toma un número finito de valores x1 , x 2 , x 3 ,..., x n , entonces la función de
0    x  x1

 f (x1 ) x1  x  x 2

distribución acumulada está dada por: F (x )   f (x1 )  f (x 2 ) x2  x  x3
  

 f (x1 )    f (xn ) xn  x  
Suponga que se lanza una moneda dos veces donde X nos respresenta la variable
aletoria del número de sellos que se pueden obtener.
a) Construya una ditribucion de probabilidad para la variable aleatoria X
b) Construya la función de distribución acumulada F (x )
Para dar solución al inciso a) consideremos el espacio muestral S  {SS, SA, AS, AA}
Número f (x )  P(X  x ) F (x )  P(X  x )

de Función de distribución acumulada
sellos
X
0 1 F (0)  P(X  0)  P(X  0)  f (0)  0.25
 0.25
4 Ya que la variable sello no puede ser menor que cero
1 2 F (1)  P(X  1)  P(X  0)  P(X  1)
 0.5
4  f (0)  f (1)  0.25  0.5  0.75
2 1 F (2)  P(X  2)  P(X  0)  P(X  1)  P(X  2)
 0.25
4  f (0)  f (1)  f (2)  0.25  0.5  0.25  1
Total 1
IPN 182 CECYT-18

La gráfica de la distribución de probabilidad queda determinada por:
Construimos enseguida nuestra función de distribución acumulativa F(x ) a través de la gráfica

y la función.
Gráfica de la función de distribución Función de distribución acumulada

acumulada
0 x 0

1 0x 1
4

F (x )   1 1 3
   1x 2
4 2 4
1  1  1  1 x2
 4 2 4
Observe que el salto que hay de cero sellos a un sello es de 0.25, el salto que hay de un sello
a dos sellos es de 0.5 y el salto que hay de dos sellos en adelante será de 0.25, es decir, el
gráfico muestra, además, la probabilidad para cada uno de los valores que toma la variable
aleatoria.
Enseguida, damos respuesta a la siguiente cuestión: Si conocemos la función de distribución

acumulada, ¿cómo calcular probabilidades?
Si contamos con la función de distribución acumulada, el cálculo de probabilidades se

simplifica enormemente, ya que, la propia función de distribución acumulada representa el
valor de las probabilidades, es decir,
IPN 183 CECYT-18

En el caso discreto para un valor k, m  X , Si los valores k, m  X , no son puntos de
puntos de discontinuidad, tenemos las discontinuidad, entonces, en el cálculo de las
igualdades siguientes en el cálculo de las probabilidades:
probabilidades:
1. P(X  k )  F (k )
2. P (X  k )  F (k  1) 1. P (X  k )  P (X  k )  F (k )
3. P (X  k )  1  F (k  1) 2. P (X  k )  P (X  k )  1  F (k )
4. P(X  k )  1  F (k ) 3. P (m  X  k )  F (k )  F (m )
5. P (m  X  k )  F (k )  F (m  1)
Sea la variable aleatoria X con valores x  {0,1, 2, 3} y función de distribución

0 x 0

0.3 0x 1

acumulada dada por: F (x )  0.5 1  x  2 , calcule
0.9 2x 3

1 3x
a) P(X  1.5)  F (1.5)  0.5 ya que, 1.5  X y, por tanto, P(X  k )  F (k )
b) P(X  1)  F (1  1)  F (0)  0.3 ya que, 1  X y, por tanto, P(X  k )  F (k  1)
c) P(X  2.4)  1  F (2.4)  1  0.9  0.1 ya que, 2.4  X y, por tanto, P(X  k )  1  F (k )
d) P(X  1)  1  F (1)  1  0.5  0.5 ya que, 1  X y, por tanto, P(X  k )  1  F (k )
e) P(0.3  X  1.5)  F (1.5)  F (0.3)  0.5  0.3  0.2 ya que, 0.3 y 0.5  X y, por tanto,
P(m  X  k )  F (k )  F (m )
Otra opción para el cálculo de las probabilidades es ubicar cada uno de los valores buscados
en las desigualdades correspondientes en la función de distribución acumulada.
Además, observe la siguiente tabla construida a partir de la función de distribución

acumulada dada.
X f (x ) F (x )
0 0.3 0.3
1 0.2 0.5
2 0.4 0.9
3 0.1 1
IPN 184 CECYT-18

Media, varianza y desviación estándar para distribuciones de
probabilidad, discretas
Recuerde que la media nos indica la localizacion central de los datos y la desviación estándar nos
describe la dispersion de los datos.
Así, una distribucion de probabilidad queda resumida por su media y su desviación estándar. La
media de una distribución de frecuencias se idenifica mediante la letra griega “miu” (   E(x) ), y la
desviación estándar, con la letra sigma (  ).
Media   E(x)
La media representa un valor típico para representar la localización central de una distribución de
probabilidad. La media de una distribución de probabilidad también recibe el nombre de “valor
esperado”. Es el valor que se esperaría observar en promedio si el experimento se repite una y otra
vez. Se trata de un promedio ponderado en el que los posibles valores de una variable aleatoria se
ponderan con sus correspondientes probabilidades de ocurrencia. Por tanto, la media de una
distribución de probabilidad discreta se calcula con la expresion:
Sea x una variable aleatoria discreta con

Media de una distribución de distribución de probabilidad P(x ) . La media
probabilidad discreta.
o valor esperado de x está dada por:
  E (x )   x  P(x )
Recuerde que, para la media en una tabla de frecuencias, f representa la frecuencia de clase y N
representa el tamaño de la población. Luego, si reescribimos la fórmula de la media de una tabla de
frecuencias, tenemos que:

 (f  x)    f  x     x  f   [x  P(x )]
N  N   N
 f 
Analice que en la fracción   , el valor de f es la frecuencia con la que ocurre x y N es el tamaño
N 
 f 
de la población; así que   representa la probabilidad del valor x , es decir, P(x ) .
N 
IPN 185 CECYT-18

Jorge se dedica a vender autos importados seminuevos en “Bonito Pueblo”. Por lo
general, Jorge vende la mayor cantidad de automóviles los domingos. Jorge desarrolló la siguiente
distribución de probabilidades de las cantidades de automóviles que espera vender un domingo
determinado.
1. ¿De qué tipo de distribución se trata?
2. ¿Cuántos automóviles espera vender Jorge en un domingo determinado?
Cantidad de Probabilidad 1. Observe que se trata de una distribución

autos P(x ) aleatoria discreta para el número de
vendidos, x automóviles vendidos.
Observe que Jorge sólo espera vender cierto
0 0.10
número de automóviles, es decir, no espera
1 0.15
vender 5 o 6 o más automóviles en un domingo.
2 0.35
Sólo puede vender 0, 1, 2, 3 y 4 autos.
3 0.30
Además, los resultados son mutuamente
4 0.10
excluyentes, ¿Qué significa esto? Que no puede
Total 1.00
vender un total de 2 y 3 autos en un mismo
domingo.
2. La media de la cantidad de automóviles vendidos se calcula multiplicando el número de

automóviles vendidos por la probabilidad de vender dicho número de automóviles y finalmente,
sumando los resultados, es decir,
  x  P(x)  (0)(0.10)  (1)(0.15)  (2)(0.35)  (3)(0.30)  (4)(0.10)  2.15

Por tanto, Jorge espera vender 2.15 autos en un día. El valor esperado se utiliza para predecir la
media aritmética de la cantidad de automóviles vendidos a la larga, es decir, si Jorge trabaja 40
domingos en un año, puede esperar vender (2.15)(40)  86 automóviles sólo los domingos (de aquí
se le llama a la media “valor esperado”).
IPN 186 CECYT-18

Varianza  2  V (x ) y desviación estándar 
La varianza,  2  V (x ) , es un promedio ponderado de las desviaciones al cuadrado de una variable

aleatoria respecto a su media. Se calcula a través de la expresión:
 [(x  )  P(x )]
2
 2  V (x ) 
La desviación estándar es la raíz cuadrada positiva de la varianza que nos describe la dispersión de
la variable aleatoria respecto a la media o valor esperado, es decir,

2
  [(x   )  P (x )]  
Según la regla práctica, para la desviación estándar, la mayoría de los valores deben caer dentro de
dos desviaciones estándar respecto a la media; no es muy común que un valor difiera de la media en
más de 2 desviaciones estándar. Esta regla no es absoluta puesto que hay expertos que utilizan 3
desviaciones estándar. De esta forma, podemos identificar valores poco comunes si se determina que
caen fuera de los siguientes límites:
a. Valor máximo común   2

b. Valor mínimo común   2
La tienda de electrónica “Ísis” vende un modelo especial de teléfono celular. Hay sólo
cuatro equipos en existencia y el gerente quiere saber cuál será la demanda de hoy para este modelo
de teléfono celular. El gerente sabe que la distribución de probabilidad para x , la demanda diaria
para el teléfono celular es como se muestra en la siguiente tabla.
x 0 1 2 3 4 5
P(x ) .15 .30 .25 .15 .10 .05
a) Encuentre la media de x o valor esperado E (x )
b) Calcula la desviación estándar
IPN 187 CECYT-18

Para resolver el ejemplo, vamos a construir la siguiente tabla:
x P(x ) x  P(x) (x   )2 (x   )2  P (x )
0 0.15 0 3.61 0.5415
1 0.30 0.30 0.81 0.243
2 0.25 0.5 0.01 0.0025
3 0.15 0.45 1.21 0.1815
4 0.10 0.40 4.41 0.441
5 0.05 0.25 9.61 0.4805
Totales 1.00   1.90  2  1.89
  1.89  1.37
a) La media  o valor esperado en este caso vale   1.90 , lo cual, nos indica que, se
espera que alrededor de 1.90 clientes quieran comprar un teléfono celular el día de hoy,
considerando que un cliente compra sólo un teléfono..
b) Según la regla práctica para la desviación estándar la mayoría de los valores deben de
caer en un intervalo de no más de dos desviaciones estándar, es decir,
  2  1.90  (2)(1.37) y por tanto (0.84, 4.64) que será en nuestro contexto (0, 4.64) .
Entonces, como x  5 está fuera del intervalo, diremos que es improbable que cinco o más
clientes deseen comprar un teléfono celular el día de hoy. De hecho, si observamos la tabla
P(x  5) es exactamente de 0.05, o sea, una vez en 20.
IPN 188 CECYT-18

ESTANDARÍZATE 13
1. En la siguiente tabla, la variable aleatoria x 2. Cuando se solicita empleo en “Boutique

representa el número de televisores en un hogar Natasha”, algunos solicitantes deben tener
de Zacatecas. Determine si se trata de una varias entrevistas antes de que se tome la
distribución de probabilidad y de ser así, calcule decisión de contratarlos o no. El número de
el valor esperado, la desviación estándar y el entrevistas requeridas y sus probabilidades
intervalo (  2 ,   2 ) . correspondientes, están dadas por: 1 (0.10), 2
(0.29), 3 (0.40), 4 (0.14), 5 (0.04) y 6 (0.03).
x P(x)
0 0.01 a) ¿La información proporcionada describe una
1 0.17 distribución de probabilidad? Justifique.
2 0.27 b) Calcule   E (x ) y 
3 0.32 c) Utilice la regla práctica de las desviaciones
4 0.15 (  2 ,   2 ) para identificar el rango de
5 0.08 valores de la cantidad común de entrevistas.
d) ¿Será inusual que se tome una decisión con
mínimo cinco entrevistas? Explique
3. Considere el lanzamiento de dos dados 4. Compruebe si las siguientes expresiones sirven

numerados del 1 al 6 y como distribución de como distribuciones de probabilidad discreta.
probabilidad a la variable producto ( x ). Luego,
a) ¿Cuál sería la distribución de probabilidad x 2
a) P(x )  , x  1, 2, 3, 4
para el producto de los números obtenidos en el 2
lanzamiento de los dos dados? Grafique x 1
b) P(x )  , x  0,1, 2, 3, 4
b) Si se lanza un par de dados, ¿Cuál sería el 15
producto esperado? 2x  1
c) ¿Sería inusual obtener un producto mayor a c) P(x )  50 , x  1,2, 3, 4, 5
35? Explique.
5. Dada la función de distribución acumulada 6. Sea X una variable aleatoria discreta con
0 x  2 función de distribución de probabilidad
 0.4, si x  1
0.1 -2  x  0


F (x )  0.3 0  x  2 , calcule 0.2, si x  0
P (X  x )   , encuentre la
0.6 2x 3 0.3, si x  2
 
1 x 3 0.1, si x  3

a) P(X  1.6) función de distribución acumulada y grafíquela.
b) P(1.4  X  2.6)
a
7. Dado que f (x )  , x  0,1, 2, 3, 4 es una distribución de probabilidad para una variable
2x
aleatoria, encuentre el valor de a.
IPN 189 CECYT-18

8. Una tienda de electrónica que vende 9. Una variable aleatoria X tiene una
calculadoras tiene en su almacén 7 calculadoras distribución de probabilidad:
de la marca “Cazio” de las cuales, 3 están
defectuosas. Si una escuela va a comprar 3 x 0 1 2 3 4 5
calculadoras para su laboratorio de física, P(x ) 0.1 0.3 0.4 0.1 ? 0.05
encuentre la distribución de probabilidad para
el número de calculadoras defectuosas; además,
a) Encuentre P(4)
a) ¿Cuál es la probabilidad de que x sea mayor b) Calcule  ,  ,

2

a 2? c) Localice el intervalo (  2 ,   2 ) ,
b) ¿Cuál es la probabilidad de que x sea 2 o ¿Cuál es la probabilidad de que X caiga en
menor? ese intervalo?
10. Sea X una variable aleatoria discreta que nos 11. Un kit de 8 tubos de ensayo para tomar
modela el número de veces que un cliente lleva muestras de sangre para detectar niveles de
a su mascota a revisión postparto con el azúcar, contiene 3 que están defectuosos. Se
veterinario en un periodo de una semana. seleccionan al azar tres tubos para tomar
Suponga que la distribución de probabilidad de muestra de sangre en pacientes. Sea x igual al
X está dada por: número de tubos defectuosos observados, donde
x  0,1, 2, 3 .
x 0 1 2 3 a) Encuentre la distribución de probabilidad
P(x ) 0.2 0.3 0.3 0.2 para x.
b) Construya la gráfica de la distribución de
a) Encuentre el número promedio de veces que probabilidad.
un cliente llevará a su mascota al veterinario en c) ¿Cuál es la probabilidad de que, al seleccionar
una semana. los tres tubos, se detecte a lo más 1 defectuoso?
b) Localice el intervalo (  2 ,   2 ) , ¿Cuál d) ¿Cuál es la cantidad de tubos defectuosos que
es la probabilidad de que X caiga fuera ese se espera obtener en una selección determinada?
intervalo?
12. ¿Toma usted café? Si es así, ¿Cuántos descansos para tomar café se da cuando está en el
trabajo o en la escuela? Casi todas las personas que toman café se dan un poco de tiempo para
tomarlo y muchas se dan más de un descanso al día para tomarlo. La siguiente tabla muestra la
distribución de probabilidad para x, el número de descansos por día que se dan quienes toman
café.
x 0 1 2 3 4 5
P(x ) 0.28 0.37 0.17 0.12 0.05 0.01
a) ¿Cuál es la probabilidad de que una persona que toma café, seleccionada al azar, no se dé
descanso durante el día para tomar café?
b) ¿Cuál es la probabilidad de que una persona que toma café, seleccionada al azar, se dé más de
tres descansos durante el día para tomar café?
c) Encuentre la probabilidad de que x caiga en el intervalo (  2 ,   2 )
IPN 190 CECYT-18

Distribuciones de probabilidad continua
Una variable aleatoria continua tiene una probabilidad 0 de adoptar exactamente cualquiera de sus
valores a diferencia de una variable aleatoria discreta. Luego, su distribución de probabilidad no se
puede presentar en forma tabular. Para profundizar un poco más estas ideas consideremos lo
siguiente:
Sea una variable aleatoria cuyos valores son estaturas de todas las personas de un grupo numeroso
y que, son mayores de 25 años de edad.
Entre cualesquiera dos valores, digamos, por ejemplo, 1.78 y 1.83 metros hay un número infinito de
estaturas (por ejemplo 1.80m). Entonces, la probabilidad de elegir a una persona al azar que tenga
exactamente 1.80m de altura en lugar de una del conjunto infinito digamos (1.78, 1.83) y con
estaturas muy cercanas a la que buscamos es nulo. Por esta razón, asignamos una probabilidad 0 a
tal evento.
En cambio, si nos referimos a la probabilidad de seleccionar a una persona que mida al menos 1.78m
pero no más de 1.83m, nos estamos refiriendo a un intervalo en vez de un valor puntual de nuestra
variable aleatoria.
En este caso, nos interesa el cálculo de probabilidades para intervalos de variables aleatorias
continuas como, por ejemplo, P (a  X  b) , P(W  c) , etc. Observamos pues, que, cuando X es
continua, P (a  X  b)  P (a  X  b)  P(X  b)  P (a  X  b) , es decir, no importa si incluimos
o no los extremos del intervalo, lo cual no sucede cuando hablamos de variables aleatorias discretas.
Una distribución de probabilidad de una variable aleatoria continua se pude representar por una
fórmula (mas no de forma tabular) como función de los valores numéricos de la variable aleatoria
continua X representada por f (x) . Así, cuando se trata con funciones continuas, a f (x) se le denomina
“Función de densidad de probabilidad” o simplemente “función de densidad de X”.
La mayoría de las funciones de densidad que tienen aplicaciones prácticas son continuas y sus gráficas
pueden tomar distintas formas; además, como se utilizarán áreas bajo curvas para representar las
probabilidades y éstas son números positivos, la función de densidad debe caer encima del eje “x”.
Algunas funciones de densidad podrían ser las siguientes:
IPN 191 CECYT-18

Una función de densidad de probabilidad se construye de modo que, el área bajo la curva limitada
por el eje “x” sea igual a 1 en el intervalo de X para el que se define f (x) .
Entonces, la probabilidad de que X tome un valor entre a y b es igual al área sombreada bajo la
función de densidad entre x  a y x  b a partir del cálculo de la integral dada por:
P(a  X  b) 
 f (x)dx
a
Requisitos para una distribución de probabilidad continua
Definición. La función f (x) es una función de densidad de probabilidad (fdp) para la

variable aleatoria X, definida en el conjunto de los números reales, si
1. f (x)  0 , para toda x  
2.
 f (x)dx  1

Para profundizar un poco sobre esta definición revisemos los siguientes ejemplos:
IPN 192 CECYT-18

Suponga la siguiente función de densidad para una variable aleatoria continua X dada
x 2
 , 1  x  2
por: f (x )   3
 0, en otro caso

a) Verifique que f (x) es una función de densidad.
b) Calcule P(0  X  1)
c) Calcule P(X  1)
Mostremos la solución.
a) Para comprobar que se trata de una función de densidad de probabilidad debemos probar que se
cumplen las dos condiciones de la definición antes mencionada, es decir:
f (x)  0 , para toda x   . En este caso x siempre será positiva para cualquier valor en el
2
1.
3
intervalo  1  x  2 ya que, se trata de una función cuadrática.

2.
 f (x)dx  1 . Para probar este punto calculamos la integral con límites infinitos, es decir,

antes de -1 y después de 2 la función vale cero y por tanto el área bajo la curva también vale
 2 2
x2 x3  (2)3   (1)3  8  1  8 1
cero; luego,


f (x )dx 

1
3
dx 
9 1
           1 . Se cumple.
 9   9  9  9 9 9
1 1
x2 x3  (1)3   (0)3  1  0  1 0 1
b) P(0  X  1) 

0
3
dx 
9 0

 9

  9
         0.1111
 9 9 9 9 9
2 2
x2 x3  (2)3   (1)3  8  1  8 1 7
c) P(X  1) 
1
3
dx 
9 1
           0.7777
 9   9  9 9 9 9 9
considere que la
variable aleatoria X toma valores mayores o iguales a 1, de modo que, se considera como límite
inferior el valor 1 y el límite superior se toma de acuerdo con la función de densidad de probabilidad.
IPN 193 CECYT-18

Sea X una variable aleatoria continua con función de densidad dada por
a(5x  x 3 ), 0  x  2
2
f (x )   , verifique el valor de a para que sea una fdp.
 0 en otro caso
Para la resolución debemos comprobar los 2 primeros

incisos de la definición anterior de modo que:
1. f (x)  0 , para toda x   . En este caso, observe

que la gráfica de la expresión (5x 2  x 3 ) siempre
nos genera valores positivos a partir de x  0 .
Por lo tanto, a debe tomar un valor positivo
para que se siga cumpliendo el requisito número
1, es decir, a  0 .

 f (x )dx  1
2. 
2 2
 5x 3 x 4   5(2)3 (2)4   5(0)3 (0)4   40  28a
 a(5x  x )dx  a     a   a  4 
2 3
  
0  3 4 
0  3 4   3 4   3  3

28a 3
Como
 f (x )dx  1 , entonces,

3
1  28a  3  a
28
.
Función de distribución acumulada
Definición. La función de distribución acumulada F (x ) es una variable aleatoria

continua X con función de densidad de probabilidad f (x ) , que está dada por
x
F (x )  P(X  x ) 
 f (t)dt para   x   .

La función de distribución acumulada (fda) nos da la probabilidad acumulada de un valor dado de

x, es decir, para determinar la probabilidad de que una observación aleatoria que se toma de la
población sea menor o igual que un determinado valor, o bien, determinar la probabilidad de que
una observación sea mayor que cierto valor o se encuentre entre dos valores.
IPN 194 CECYT-18

Calcule F (x ) (función de distribución acumulada) para la función de densidad
x 2
 , 1  x  2
dada por f (x )   3 y utilice este resultado para calcular P(0  X  1) .
 0, en otro caso

Tenemos que para (1  x  2) , la función de distribución acumulada está dada por
x x x
t2 t3  x3   1  9x 3  9 x 3  1
F (x ) 


f (t )dt 

1
3
dt 
9 1
 
 9
    
  9  81

9
, por lo tanto, la función de
distribución acumulativa y la función de densidad de probabilidad, están dadas por:
Función de densidad de
Gráfico de la función de densidad probabilidad
x 2
 , 1  x  2
f (x )   3
 0, en otro caso

Función de distribución
Gráfica de la función de distribución acumulada acumulada
 0, x  -1
 3
x  1
F (x )   , -1  x  2
 9
 1, x 2

(1)3  3 (0)3  3 1
Así, para calcular P (0  X  1)  F (1)  F (0)    . Advierta que el resultado
9 9 9
obtenido a través de la función de distribución acumulada se puede obtener de manera directa
1
x2 1
calculando P (0  X  1) 

0
9
dx  .
9
IPN 195 CECYT-18

Una variable aleatoria continua X, que puede tomar valores entre x  1 y x  3 ,
1
tiene una función de densidad de probabilidad dada por f (x )  .
2
a) Muestre que el área bajo la curva es igual a 1
b) Calcule P(2  X  2.5)
c) Calcule la función de distribución acumulada
d) Calcule P(X  1.6)
 3 3
1 x 3 1
a) Para mostrar que el área bajo la curva es igual a 1, calculamos
 f (x)dx  
 1
2
dx    1
21 2 2
2.5 2.5
1 x 2.5 2 1
b) Para calcular P(2  X  2.5) , tenemos que, P(2  X  2.5) 

2
2
dx 
22

2
 
2 4
c) Para calcular la función de distribución acumulada tenemos que

x x x
1 t  x   1  2x  2 x  1
F (x ) 
 f (t)dt  
 1
2
dt     
2 1 2 2 4

2
, por lo tanto, la función de distribución
 0, x 1

x  1
acumulada, está dada por F (x )   , 1  x  2.
 2
 1, x 2
1.6  1
d) Para calcular P(X  1.6) , tenemos que, P (X  1.6)  F (1.6)   0.3
2
Función de densidad de
probabilidad
Función de distribución
acumulada
IPN 196 CECYT-18

Con base en pruebas extensas, el fabricante de una lavadora determinó que el tiempo
Y en años para que la lavadora requiera mantenimiento general se obtiene mediante la siguiente
función de densidad de probabilidad:
 1 y /4
 e , y0
f (x )   4
 0, en otro caso

a) Calcule la función de distribución acumulada
b) Se considera que una lavadora es una ganga si no hay probabilidades de que requiera una
reparación general antes del sexto año, ¿Qué podemos decir al respecto? Calcule P(Y  6)
c) ¿Cuál es la probabilidad de que la lavadora requiera una reparación general durante el primer
año?
a) Para calcular la distribución de probabilidad acumulada, tenemos que,

y y
1 t /4
   
y
F (y ) 


f (t )dt 

0
4
e dt  e t /4  e y /4  e 0/4  e x /4  1 , por lo tanto, la función de
0
distribución acumulativa está dada por:
 0, y0
F (y )  P(Y  y )    x /4
 e  1, 0 y  
b) Para calcular la probabilidad de que la lavadora requiera reparación general


1 y /4
   
b


P(Y  6)  e dy  e y /4  lim  e y /4   lim e b /4  lim e 6/4
4 6 b  6 b  b 
, entonces, la probabilidad
6

 0  lim e 6/4  0.2231
b 

es muy alta, lo cual significa que, hay un 22.31% de que la lavadora requiera reparación general
después de los 6 años; luego, no resulta ser una ganga.
c) Para calcular la probabilidad de que la lavadora requiera una reparación general durante el primer
año, está dada por la
1
1 y /4
   
1
P(0  Y  1) 

0
4
e dy  e y /4  e 1/4  e 0/4  0.7788  1  0.2211
0
IPN 197 CECYT-18

Media, varianza y desviación estándar para distribuciones de
probabilidad, continuas
Es común referirse a la media como esperanza matemática o valor esperado de la variable aleatoria
X y denotarla por E [x ] . Recuerde que la media se considera un valor central de la distribución.
Media   E(x)
Definición. Sea X una variable aleatoria continua con función de densidad de


probabilidad f ( x) , la media o valor esperado de X es   E[x ] 

 x  f (x)dx

Para aclarar un poco el uso de la media, valor esperado o esperanza matemática, analicemos el
siguiente ejemplo, que muestra el interés de un ingeniero por la vida media de cierto tipo de
dispositivo electrónico, es decir, el tiempo que transcurre antes de que se presente una falla. Luego,
el valor esperado de la vida del dispositivo es un parámetro importante para su evaluación.
Sea X la variable aleatoria que denota la vida en horas de cierto dispositivo electrónico
 20000
 3 , x  100
cuya función de densidad de probabilidad es f (x )   x , calcule el tiempo de
 0, en otro caso

vida en horas esperado para esta clase de dispositivo.
Para calcular el valor esperado o media para la función de densidad dada, tenemos que,
 
 20000 
  E [X ] 


x  f (x )dx 
 x  
100
x3 
 dx
 b
20000  20000   20000 20000 


100
x 2
dx  lim  
b 

  lim
x  100 b 

 b
   200
(100) 
Por lo tanto, se espera que en promedio el dispositivo dure 200 horas.
IPN 198 CECYT-18

Suponga que la demanda diaria de frijol en un supermercado es una variable aleatoria
 1
 x, 0  x  500
X con función de densidad de probabilidad dada por f (x )  
500 2
en kg.
 1 1000  x , 500  x  1000  
 5002
a) Determine la probabilidad de que en un día cualquiera se vendan entre 400kg y 800kg.
b) ¿Cuál es la cantidad promedio que se esperaría vender en un día cualquiera?
c) Si se sabe que se han vendido más de 200kg en un día particular, encuentre la probabilidad de que
se hayan vendido más de 400kg.
a) Para calcular la probabilidad de que en un día cualquiera se vendan entre 400 y 800 kilogramos,
tenemos que:
500
500 800 800
1 1 1 1  x2 
P(400  X  800) 
400
500 2xdx 
500
500 2 
(1000  x )dx 
2  5002
x2
 

5002
 1000x  
 2
500
400
 1 8   48 3  9 21 30
        0.6
 2 25   25 2  50 50 50
b) Para calcular el valor esperado tenemos que:

 500 1000 500 1000
1 1 1 2 1
E [X ] 
 x  f x  dx  
 0
x
5002
xdx  x 
500
5002 
(1000  x )dx 

0
500 2
x dx 
500
5002
(1000x  x 2 )dx
500
1000
x3 1  x3   500   2000 1000 
 500x    0     500kg
2
   

3  5002  0
5002  3 
500  3   3 3 
c) Si se sabe que se han vendido más de 200kg en un día particular, para encontrar la probabilidad
de que se hayan vendido más de 400kg, tenemos lo siguiente:
400
1
  
P  X  400  X  200  P(X  400) 1  P(X  400) 
1
 500 2
xdx
P(X  400 | X  200)      0
P(X  200) P(X  200) 1  P(X  200) 200

1
1
0
5002
xdx
400
1 8 
1 x2 8

2  500 2
 0
1    0 1 
 25   25  0.68  0.7391
 
200
2  2 0.92
1 1    0 1 
1 x2  25  25

2  500 2
 0
IPN 199 CECYT-18

Varianza y desviación estándar para distribuciones de
probabilidad, continuas
Definición. La varianza de una variable aleatoria continua X con función de densidad


f (x) se define como:   V (x ) 

x  f (x )dx   2
2 2

La desviación estándar (típica) para una variable aleatoria continua X con función
de densidad f (x) se define como la raíz cuadrada de la varianza, es decir,
  V (x )   
x  f (x )dx   2
2 2

Sea la siguiente función de densidad de probabilidad, calcula el valor esperado, la

 x
1  , 0  x  2
varianza y la desviación estándar. f (x )   2
 0, en otro caso

Calculamos la media o valor esperado, es decir,
 2 2 2
 x  1 2 1 2 1 3

 0

  E [X ]  x  f (x )dx  x   1   dx 
 2 
0
 x  x  dx   x  x 
 2  2 6 0
1 1  1 1   8 2
  (2)2  (2)3    (0)2  (0)3    2    (0)   0.6666
2 6  2 6   6 3
Luego para el cálculo de la varianza, tenemos de acuerdo con la definición:

2  x   2
2
2  x3    2 
2
 
   
  V (x )  x  f (x )dx    x  1   dx      x   dx   

2 2 2 2 2
 2  3   2   3
 0   0 
2 2 2
1 1  2 1 1  1 1  2 2 4 2
  x 3  x 4       (2)3  (2)4    (0)3  (0)4        0   
3 8 0 3 3 8  3 8  3 3 9 9
2
Finalmente, la desviación estándar será   V (x )   2   0.4714
9
IPN 200 CECYT-18

Sea una función de densidad de probabilidad continua de una variable aleatoria X
6x (1  x ), 0x 1
dada por f (x )  
 0, en otro caso
a) Calcula la P(X  1 | X  0.2)
b) La media   E[x ]
c) La desviación estándar   V [X ]
a) Para calcular la probabilidad condicional, tenemos que

0.8
 (6x  6x )dx
2
P(X  0.8  X  0.2) P(0.2  X  0.8)

P(X  0.8 | X  0.2)    0.2
P(X  0.2) 1  P(X  0.2) 0.2
1
 (6x  6x )dx
2
112 13 99
   
0.8
3x 2  2x 3 3(0.8)2  2(0.8)3  3(0.2)2  2(0.2)3 
99
 0.2
  125 125  125   0.8839
0.2 2
 3 2
 
1  3x 2  2x 3  1   3(0.2)  2(0.2)  3(0)  2(0)  1   13  0 
3

112 112
  125
0 
 125
b) Para calcular la media   E[x ] , tenemos que:
 1 1 1
 3x 4  3 1
    
  E [X ]  x  f x dx  x (6x (1  x ))dx  (6x  6x )dx   2x 3 
2
2 
  2  
3
2 2
 0 0  0
c) Para calcular la desviación estándar, calculamos primero la varianza, es decir,


  V (x ) 
x  f (x )dx   2 ,
2 2
con lo que,


1   1 2  1   1 2
 
  V (x )  x  f (x )dx    x (6x  6x )dx     (6x  6x )dx    
  

2 2 2 2 2 3 4
  2   2
 0  0 
1 2 2
 3x 4 6x 5  1  3(1)4 6(1)5   3(0)4 6(0)5    1  3 6 1 1
                        0.05
 2 5 
0  2 
  2 5   2 5    2  2 5 4 20

1
Luego, el valor de la varianza está dado por   V (x ) 
 x 2  f (x )dx   2   0.05 Finalmente,
2
20

la desviación estándar está dada por   V [X ]  0.05  0.2236
IPN 201 CECYT-18

Considera una variable aleatoria continua X que tiene función de densidad dada por
x , 0x 1

f (x )  2  x , 1x 2
 0, en otro caso

a) Calcular P(X  0.5)
b) Calcular P(0.5  x  1.5)
c) Calcular la desviación estándar
Solución:
a) Tenemos que la probabilidad de que la variable aleatoria sea menor que 0.5, implica calcular
0.5 0.5
x2 (0.5)2 (0)2 1
P(X  0.5) 
 0
xdx 
2
0

2

2
  0.125
8
b) La probabilidad de que la variable aleatoria tome valores entre 0.5 y 1.5 está dada por
1 1.5 1 1.5
x2  x2 
P (0.5  x  1.5) 
 xdx  
0.5 1
(2  x )dx 
2 0.5
  2x  
 2 
1
 (1)2 (0.5)2   (1.5)2   (1)2 

    
   2(1.5)  
  2(1)   
 2 2   2   2 
3  9 1 3
   3   2     0.75
8  8 2 4
c) Para la desviación estándar calculamos primeramente el valor esperado o media, es decir,

 1 2 1 2
1 2
  E [X ] 
 x  f (x )dx 
 x (x )dx 
 x (2  x )dx 
 x 2dx 
 (2x  x )dx  3  3  1 , luego,
2
 0 1 0 1

 1
 2
1 2

      
2 2
  V (x )  x  f (x )dx     x 2 (x )dx  x 2 (2  x )dx   1
2 2 2
  x dx  (2x 2  x 3 )dx   1
3
   
 0 1  0 1 
1 11 7 1
 
2
   1   1   0.1666
4 12 6 6
1
Finalmente, la desviación estándar está dada por   V [X ]   0.4082
6
IPN 202 CECYT-18

ESTANDARÍZATE 14
1. Dada la siguiente función de densidad, 2. Dada una variable aleatoria continua X y una
determina lo siguiente: función f (x ) , definida en todos los reales,
determine el valor de k con el que f (x ) es una
 x3  función de densidad de X.
 x   , si 0  x  2
f (x )   4 kx , x  [0, 2)
 
0, en otro caso 2k ,
f (x )  
x  [2, 3)
Determine k y
8k  2kx , x  [3, 4)
a) ¿Se trata de una fdp?  0, en otro caso

b) Calcula la P(X  1.7) calcule:
c) Calcula la P(0.5  X  1)
d) Calcula la P(X  1.5) a) La función de distribución acumulada
e) Calcula la P(X  1.5 | X  1.2) b) Calcule la P(2.5  X  3)
c) Calcula la P(X  3 | X  2)
3. Determina si las siguientes funciones de 4. Determine el valor de k para que f (x ) sea una
densidad, nos sirven para calcular función de densidad de probabilidad.
probabilidades.
x , x  (0,1)

a) f (x )  5  x , x  [1, 2]
0, en otro caso

 1
x  , x  (1,1)
b) f (x )   2
0, en otro caso

5. Sea X una variable aleatoria con función de 6. Sea X una variable aleatoria continua con
densidad e ,
x
x 0
función de densidad f (x )  
0, x 0
kx , x  (0, 2)

f (x )  k (4  x ), x  [2, 4] a) Determine si se trata de una función de
0, en otro caso
 densidad de probabilidad.
b) Determine el valor esperado para la variable
a) Obtenga el valor de k con el cual f (x ) es una aleatoria.
función de densidad de probabilidad. c) Calcule P(X  1.5)
b) Calcule le valor esperado de la variable d) Calcule P(0.5  X  10)
c) Calcule la función de distribución acumulada
d) Calcule la desviación estándar para la
variable aleatoria.
IPN 203 CECYT-18

7. La vida útil en días, para un cierto 8. Sea f (x ) una función de densidad de
medicamento de prescripción médica es una probabilidad de un variable aleatoria X,
variable aleatoria que tiene la siguiente función
cuya gráfica está dada por:
de densidad de probabilidad:
 20, 000
 , x 0
f (x )  (x  100)3
0, en otro caso

Calcule la probabilidad de que un frasco de este
medicamento tenga una vida útil de
a) al menos 200 días
b) cualquier lapso entre 80 y 120 días.
a) Determina el valor de c y posteriormente la
c) Calcule el tiempo promedio de vida del
función de densidad de probabilidad de X
medicamento.
b) Hallar la función de distribución acumulada
d) ¿Cuál es la probabilidad de que el
F(x)
medicamento funcione más de 150 días dado que
ya ha durado 100 días en buen estado? 5 7
c) Usando F(x) , calcular P   X  
2 2
9. La función de densidad de probabilidad de 10. El tiempo que pasa, en horas, antes de que
una variable aleatoria continua X, es descrita un componente que forma parte de un
por: reproductor DVD empiece a fallar tiene la
x siguiente función de densidad:
 si 0  x  1
 2  1 x
 e 2000 si x  0
1 si 1  x  2
f (x )   2000

f (x )   2 0,
 en otro caso
 x  3
 si 2  x  3 a) Calcule la probabilidad de que el componente
 2 funcione más de 1000 horas antes de fallar.
0, en otro caso
b) Determine la probabilidad de que el
Determina F(x) . componente falle antes de 2000 horas.
11. Una gasolinera tiene dos bombas y cada una tiene una capacidad de despachar hasta 10,000
litros de gasolina por mes. La cantidad total de gasolina despachada en un mes es una variable
aleatoria X (expresada en decenas de miles de litros), con una fdp dada por:
x si 0  x  1

f (x )  2  x si 1  x  2
0, en otro caso

a) Calcular la probabilidad de que la gasolinera despache entre 8000 y 13000 litros de gasolina en
un mes.
b) Si se sabe que la gasolinera ha despachado más de 12000 litros de gasolina en un mes en
particular, encuentre la probabilidad de que haya despachado más de 18000 litros durante el mes.
IPN 204 CECYT-18

IPN 205 CECYT-18

Probabilidad

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Probabilidad

Cargado por

Copyright:

Formatos disponibles

Contenido

1. ESTADÍSTICA DESCRIPTIVA ................................................................................................. 4

Cuartiles (Qk ) para datos no agrupados ................................................................................ 53

Cuartiles (Qk ) para datos agrupados..................................................................................... 56

Deciles ( Dk ) para datos no agrupados y agrupados ............................................................... 58

Percentiles ( Pk ) para datos no agrupados y agrupados ........................................................... 61

Diagramas de caja y bigotes....................................................................................................... 64

Media   E(x ) ................................................................................................................... 185

Varianza  2  V (x ) y desviación estándar  ..................................................................... 187

Distribuciones de probabilidad continua .................................................................................. 191

Media   E(x ) ................................................................................................................... 198

Varianza y desviación estándar para distribuciones de probabilidad, continuas .................... 200

a) En ingeniería se enfoca en la cantidad y la calidad de unidades que fabrica una determinada

Entonces, ¿Por qué estudiar estadística?

La estadística se divide en dos grandes ramas:

Se analiza cómo se juntan

Estadística descriptiva e inferencial

ESTADÍSTICA DESCRIPTIVA. Es una rama de la estadística que

La estadística descriptiva incluye la construcción de gráficas, tablas, cuadros y el cálculo de varias

Si el conjunto de mediciones es toda la población sólo se necesita obtener conclusiones basadas en la

En México, hay aproximadamente 40,812km de carreteras federales, 9,174km de autopistas

El objetivo de la estadística inferencial es hacer inferencias (obtener conclusiones, hacer predicciones,

Si se estudia el comportamiento de un número reducido de personas, se podría inferir como

1. Especifique las preguntas a contestar e identifique la población de interés. En la

Si se quiere evaluar la calidad educativa de los bachilleratos en México, se aplican exámenes

VARIABLE CUALITATIVA. Una variable es cualitativa cuando la

Lo anterior se resume en la siguiente tabla:

- Peso de una persona

MUETREO. Es un conjunto de métodos y procedimientos para obtener muestras

Suponga que, de la población estudiantil del Cecyt18 se seleccionan de manera aleatoria 20

A cada estudiante le asignamos un número entre 1 y 1000.

Muestreo sistemático con iniciación aleatoria

En este método la primera unidad se selecciona de forma aleatoria y el resto siguiendo un

Conseguir un listado ordenado de los N alumnos de la población total.

Definir el intervalo del tamaño de selección o salto sistemático k  360

= 0.32 → 𝑛 = 0.32 × 200 = 64 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠

= 0.25 → 𝑛 = 0.25 × 200 = 50 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠

= 0.43 → 𝑛 = 0.43 × 200 = 86 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠

Muestreo por conglomerados

Este tipo de muestreo es similar al muestreo estratificado debido a que la población

Como la población es demasiado grande, la dividimos en estratos (estaciones del metro).

Esta forma de muestreo disminuye considerablemente el costo de la muestra ya que no requiere

Distribución de frecuencias (tabla de frecuencias). Indica cómo un conjunto

La frecuencia (frecuencia absoluta) de

Para elaborar un histograma analicemos

Determinar el entero más cercano a n , en donde n es el número total de observaciones.

4. Los límites de las clases. Podemos elegirlos de la siguiente manera:

Número de CLASES FRECUENCIA DE NÚMERO DE

3 [4.992-5.000) ///// /// 8

4 [5.000-5.008) ///// //// 9

6 [5.016-5.024) ///// ///// ///// 15

Resultando la siguiente tabla:

NÚMERO DE CLASES O FRECUENCIA

Número de CLASES FRECUENCIA DE NÚMERO DE DATOS

Resultando la siguiente tabla:

NÚMERO DE CLASES O FRECUENCIA

Precios de venta Marca de clase o punto medio del Frecuencia

[21 a 24) 22.5 17

[24 a 27) 25.5 18

[27 a 30) 28.5 8

[30 a 33) 31.5 4

[33 a 36) 34.5 2

Construye un polígono de frecuencias para la información dada.