Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tiempo: 4 horas
Temática
Aprendizajes
El alumno:
• Adquiere una primera noción de la Estadística y su utilidad.
• Explica el significado que tienen los términos variable, población y muestra.
• Conoce la importancia de trabajar con muestras seleccionadas de alguna
población.
• Explica la noción de variabilidad en Estadística.
• Conoce la noción de “azar” y la necesidad de medirlo.
• Conoce que es posible hacer mal uso de la información estadística.
Noción de la Estadística
Utilidad de la Estadística.
En resumen, existen por lo menos tres razones para estudiar estadística, las
cuales mencionamos a continuación:
EJERCICIOS
Determina cuál de las siguientes proposiciones es de naturaleza descriptiva y
cuál es inferencial.
2. Nociones básicas.
• Variable, población y muestra.
• Variabilidad.
• Azar y probabilidad
Por ejemplo, Raúl Serrano ingresó al CCH a la edad de “15” años, su cabello
es “negro”, mide “1.65”, pesa “63” Kg. y desea estudiar “Medicina”. 15, negro,
1.65, 63 y Medicina son los valores de las cinco variables aplicadas a Raúl
Serrano.
El “color de sus ojos”, “la colonia donde habita”, la “religión que profesa” son
ejemplos de variables cualitativas.
Ejemplo 2. El tiempo medio necesario para pagar y salir para todos los clientes
de la tienda X , debe estimarse utilizando el tiempo medio para pagar y salir
necesario de 75 clientes elegidos aleatoriamente. Haz corresponder las
expresiones de la columna dos con los términos estadísticos de la columna
uno.
1 2
EJERCICIOS
Variabilidad
EJERCICIO
56, 54, 62, 76, 46, 56, 58, 52, 48, 66, 64, 62, 56, 58, 72, 80, 74, 68, 79, 69.
De algunas cosas estamos seguros, pero hay cosas sobre las que no tenemos
seguridad. Podemos asegurar que: mañana sale la luna, si metemos la mano
en agua hirviendo se nos quemará, no podemos atravesar paredes, y si
soltamos un balín en el agua se hundirá. Hemos adquirido la seguridad por
medio de nuestra experiencia, y tan seguro estamos de estas cosas, que ni
siquiera pensamos en hacer algún experimento para comprobar si son ciertas.
Pero no podemos asegurar que mañana lloverá, o que habrá un terremoto, o
que hoy gane en el Melate.
Con esto te puedes dar cuenta de que, según el tipo de resultados que nos
interese observar, podemos distinguir dos clases de fenómenos: los fenómenos
de los que tenemos seguridad del resultado que tendrán y los fenómenos sobre
cuyos resultados tenemos duda o incertidumbre. Cuando tenemos duda sobre
cual será el resultado de un fenómeno, decimos que es un fenómeno de azar
(la palabra azar significa que no hay certeza o seguridad) si estamos seguros
de lo que va a ocurrir, entonces decimos que el fenómeno es determinista,
porque su resultado está completamente determinado.
EJERCICIOS
La estadística puede ser una herramienta muy útil que nos ayuda a conocer la
realidad. Sin embargo, puede también servir para mentir. . . si no se tiene
cuidado de usar correctamente los métodos estadísticos y de interpretar
correctamente sus resultados.
Es famoso el dicho que expresa: “hay tres clases de mentiras: las mentiras, las
grandes mentiras, y la estadística”. (Este dicho se atribuye a Benjamín Disraeli
y tiene más de un siglo. Curiosamente, la cita aparece con frecuencia en los
libros de estadística, aunque parece hacerle poca propaganda a la disciplina)..
. Lo que ocurre es que la estadística, como toda herramienta, no puede
cometer errores por sí misma: los errores y las mentiras son responsabilidad de
quien las usa incorrectamente.
30 30
20
10
0 1 20 1
I II
Cantidad de lluvia
Tiempo: 24 horas
Temática
1. Recopilación de datos.
2. Tablas de distribución de frecuencias.
3. Representaciones gráficas.
4. Medidas de tendencia central
5. Medidas de dispersión y de posición.
6. Regla Empírica.
Aprendizajes
El alumno:
• Valora la importancia de la recopilación de datos en el proceso de una
investigación
• Construye tablas de frecuencias para representar el comportamiento de
variables cualitativas y variables cuantitativas.
• Interpreta tablas para describir el comportamiento de un conjunto de
datos.
• Construye histogramas, polígonos de frecuencias, ojivas, gráficas de
barras, circulares y de caja.
• Interpreta gráficas para describir el comportamiento de un conjunto de
datos.
• Conoce las propiedades de las medidas de tendencia central.
• Calcula la media aritmética, la mediana y la moda para datos agrupados
y no agrupados.
• Argumenta la elección de una medida de tendencia central para
describir el comportamiento de un conjunto de datos.
• Conoce el concepto de dispersión en la descripción de un conjunto de
datos.
• Calcula la desviación estándar y la varianza, y comprende su
significado.
• Calcula las medidas de posición y comprende su significado.
• Conoce la Regla Empírica.
• Genera los intervalos establecidos por la Regla Empírica.
1. RECOPILACIÓN DE DATOS.
Introducción.
Los dos métodos que se utilizan para recolectar datos a fin de realizar un
análisis estadístico son los experimentos y los estudios observacionales. En un
experimento, el investigador controla o modifica el entorno y observa el efecto
sobre la variable bajo estudio. Considera como ejemplo un experimento en el
que se examinan cantidades diferentes de fertilizante para determinar si ellos
incrementan o no la producción. Primero, varias parcelas de tierra son
especificadas, y varios tratamientos de fertilización son asignados
aleatoriamente, para hacerlos corresponder con las parcelas de tierra. En un
estudio observacional, el investigador no modifica el entorno y no controla el
proceso en observación. Los datos se obtienen al muestrear a alguien de la
población de interés. A menudo, las encuestas son estudios observacionales
de gente, otros ejemplos son: el manejo de mediciones sobre los
desempleados, una prueba de una muestra de focos, entre otros.
En la estadística uno de los peores errores es reunir datos en una forma que
no sea la adecuada. Por ejemplo, una muestra de respuesta voluntaria es
aquella donde los sujetos deciden por sí mismos si responden o no. Este tipo
de muestras son muy comunes, aunque sus resultados por lo general resultan
inútiles para hacer inferencias válidas acerca de poblaciones muy grandes.
Ahora definiremos algunos de los métodos de muestreo más comunes.
Definiciones.
Una muestra aleatoria es aquella donde los miembros de una población se
seleccionan de manera que cada miembro individual tiene la misma posibilidad
de ser elegido.
Además del muestreo aleatorio, hay otras técnicas de muestreo en uso, y las
más comunes se describen a continuación.
EJERCICIO.
1. Supongamos que has sido contratado por Visa para realizar un estudio del
uso de tarjeta de débito entre los estudiantes becados que asisten a la
Universidad. Describe un procedimiento para obtener una muestra de cada
tipo: aleatoria, sistemática, estratificada y por conglomerados.
Las tablas son el medio más utilizado para organizar información. Una tabla es
un arreglo rectangular que consiste de un título, una o más filas, dos o más
columnas y una leyenda que indica la fuente de información de donde se
obtuvieron los datos.
0, 2, 5, 3, 3, 3, 5, 1, 5, 5, 2, 5, 6, 3, 6, 4, 6, 4, 6, 2, 2, 1, 4, 1, 3, 2, 5, 5, 3, 1,
5, 3, 4, 2, 3, 3, 5, 4, 4, 1, 5, 3, 4, 3, 3, 3, 2, 4, 3, 2, 5, 5.
0 ⏐ 1
1 ⏐⏐⏐⏐ 5
2 ⏐⏐⏐⏐ ⏐⏐⏐ 8
3 ⏐⏐⏐⏐ ⏐⏐⏐⏐ ⏐⏐⏐ 13
4 ⏐⏐⏐⏐ ⏐⏐⏐ 8
5 ⏐⏐⏐⏐ ⏐⏐⏐⏐ ⏐⏐ 12
6 ⏐⏐⏐⏐ 4
3 2 2 3 2
4 4 1 2 2
4 3 2 0 2
2 1 3 3 1
x f
0 1
1 3
2 8
3 5
4 3
Distribución de frecuencias de atributos
Para datos cualitativos, las clases están inherentemente definidas. Por esa
razón, para construir una tabla de frecuencias simplemente hacemos un conteo
del número de datos que caen dentro de cada clase y determinamos su
frecuencia.
Las frecuencias ( fi ) son el número de datos que quedan incluidos en cada IC,
así en el primer IC (52 – 58) hay 2 datos siendo 2 la frecuencia para ese primer
IC De la misma forma se obtienen las fi para los demás IC. La suma de todas
las frecuencias debe ser igual al tamaño de la muestra.
Solución.
Con las definiciones anteriores, podemos contestar las preguntas, pero antes
es conveniente ordenar los datos (en este caso lo haremos de menor a mayor,
aunque puede ser de mayor a menor)
53, 57, 59, 60, 60, 60, 61, 61, 62, 62, 62, 62, 63, 63, 65, 65, 65, 66, 67, 67,
68, 68, 68, 69, 71, 71, 71, 72, 72, 73, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75,
75, 75, 75, 76, 76, 76, 76, 77, 77, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82,
82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88, 89, 90, 93, 93, 94, 95, 95, 96, 97.
EJERCICIOS
1. Una profesora del colegio, obtuvo los siguientes datos que representan el
tiempo que tardan sus alumnos de su casa a su salón de clases.
27 23 22 38 43 24 25 23 22 52 31 30 29 28 27 25
29 28 26 33 25 27 25 21 23 24 18 23
Construye una tabla de frecuencias.
9 8 7 8 4 3 2 1 0 5
3 2 1 1 7 3 2 8 7 6
6 4 3 2 2 0 9 4 6 9
6 9 4 3 5 7 3 2 1 4
4 2
Con los datos anteriores, construye una tabla de frecuencias.
12 8
15 10
20 7
22 13
35 10
40 2
4. En un curso donde se utilizaron computadoras se distribuyó un cuestionario
a 200 estudiantes. Una de las preguntas era “Me gusta utilizar las
computadoras”. Las apreciaciones a esta interrogante fueron:
Respuesta Número
Totalmente de acuerdo 50
De acuerdo 75
Apenas de acuerdo 25
Apenas en desacuerdo 15
En desacuerdo 15
Totalmente en desacuerdo 20
7. Los siguientes datos son los saldos de 100 cuentas pendientes tomadas del
libro de la tienda X .
31 38 41 52 59 46 74 69 39 60
69 83 78 74 77 35 79 80 71 65
56 69 34 33 92 37 60 43 51 61
74 68 83 49 34 71 58 83 94 66
78 48 34 50 68 65 64 95 92 81
77 84 41 40 38 60 67 38 50 86
76 99 38 94 48 70 80 95 98 42
55 49 54 60 62 70 88 94 85 51
59 68 51 87 53 57 54 46 46 76
69 64 61 78 55 66 73 75 63 64
3. REPRESENTACIONES GRÁFICAS
Los datos tal como se obtienen de una investigación están en forma
desordenada, como ya lo hemos visto, por lo que es difícil su interpretación y
análisis. Debido a esto se deben organizar en tablas y gráficas para permitir
una visualización clara y rápida de todo el conjunto. Por ejemplo, los gerentes
de venta, analistas de valores, directores de hospital y otros ejecutivos con
frecuencia necesitan tener una noción rápida de la tendencia de ventas,
precios de acciones o costos de administración. Estas tendencias pueden
mostrarse mejor utilizando diagramas o gráficas. Tres diagramas que
representan de manera adecuada, una distribución de frecuencias son el
histograma, el polígono de frecuencias y la ojiva (polígono de frecuencias
acumuladas).
80
70
60
50
40
30
20
10
299.5 399.5 499.5 599.5 699.5 799.5 899.5 999.5 1099.5 1199.5
Histograma de frecuencias
La clase 300 – 399 está representada por su marca de clase 349.5. Para
localizar el primer punto, es necesario trasladarse horizontalmente a 349.5,
punto medio, y después verticalmente hasta 14, la frecuencia de clase, y
colocar un punto. Los valores x e y que determinan la ubicación del punto se
conocen como sabemos coordenadas. Las coordenadas del siguiente punto
son x = 449.5, y = 46. Este proceso continúa hasta considerar todas las
clases. Después los puntos, uno tras otro, se unen con segmentos. El punto
que representa la primera clase se une con el que representa la segunda, y así
sucesivamente. Observa que para completar el polígono de frecuencias, se
agregaron las marcas de clase 249.5 y 1249.5 a los dos extremos, y el
polígono se “ancló” al eje horizontal en la frecuencia cero. Estos dos valores,
249.5 y 1249.5, se obtuvieron restando 100 a la marca de clase menor (349.5)
y sumando 100 a la marca de clase mayor (1149.5). A continuación se
presenta el polígono de frecuencias sobre el histograma ya construido del
ejemplo 5.
80
Polígono de frecuencias
70
60
50
40
30
20
10
299.5 399.5 499.5 599.5 699.5 799.5 899.5 999.5 1099.5 1199.5
Histograma y polígono de frecuencias
Ojivas
Segundo. Usa los límites reales superiores para marcar los puntos en el eje
horizontal y las frecuencias para los puntos en el eje vertical.
Tercero. Completa la construcción de la ojiva. Ve que la frecuencia acumulada
para la frontera inferior de la primera clase es 0.
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0
12450 14350 16250 18150
Ingresos promedio
Completa la tabla.
Actividad 2. Traza una ojiva “más de“ para los datos de las rentas de
condominios.
Rentas mensuales Número de unidades
$600 - $799 3
800 – 999 7
1000 – 1199 11
1200 – 1399 22
1400 – 1599 40
1600 – 1799 24
1800 – 1999 9
2000 – 2199 4
Rentas mensuales fi Fi
Más de $599.5 3 120
Más de 799.5 7 117
Más de 999.5
Más de 1199.5
Más de 1399.5
Más de 1599.5
Más de 1799.5
Más de 1999.5
Más de 2199.5
Fi
60
30
599.5 799. 1399.5 2199.5 Rentas mensuales
Ojiva “más de“ para las rentas.
EJERCICIOS
1. Las puntuaciones obtenidas en una prueba de aptitud mecánica se
organizaron en la distribución siguiente.
Clase Frecuencia
75 – 89 10
90 – 104 11
105 – 119 23
120 – 134 26
135 – 149 31
150 – 164 23
165 – 179 9
180 – 194 9
195 – 209 6
210 – 224 2
4. Una empresa comercial organizó en una tabla los salarios (por hora) de 80
empleados de medio tiempo y de tiempo completo. Por ejemplo, incluyó un
salario de $44.90 en la clase $20 - $40 pero uno de $45 en la siguiente
clase superior ($50 - $70). He aquí la tabla.
Gráfica de barras
mes
Comida 20%
Para construir una gráfica circular, el primer paso consiste en trazar un círculo,
y como sabemos hay 360 grados en él. Para graficar, por ejemplo, el 40% para
gastos de la casa, este porcentaje se convierte en grados. La respuesta es 144
grados, que se obtiene por 0.4(360). Después utilizando un transportador, se
localiza el punto de 144 grados en la circunferencia. Las líneas trazadas desde
las marcas de 0 y 144 grados hacia el centro del círculo abarcan el porcentaje
de gastos de la casa, según se muestra a continuación.
0
144°
40%
EJERCICIOS
1. En la siguiente tabla se muestra el número de casos de cada tipo de
operación realizada en el Hospital General, el año pasado.
Tipo de operación Número de casos
Torácica 20
Huesos y articulaciones 45
Ojos, oídos, nariz y garganta 58
General 98
Abdominal 115
Urológicas 74
Proctológicas 65
Neurocirugía 23
a. Construye una gráfica de barras
b. Construye una gráfica circular.
2. Utiliza la gráfica de barras que se muestra para responder a las siguientes
preguntas:
300
220
200 178
93 61
100 35 44
Departamento
del interior
(70%)
40
35
30
Monto
25
20
15
10
A B C D E
Empleado
Ventas del último año (en cientos de dólares)
Hay varias medidas de tendencia central que se usan para encontrar un centro
de un conjunto de datos; tres son las que vamos a estudiar y son: la media
aritmética (media), la mediana y la moda. Examinemos ahora con detalle cada
medida de tendencia central y empecemos dando sus definiciones.
Notación: x
La media aritmética de un conjunto de n observaciones x1 , x2 , x3,L , xn en forma
simbólica es:
n
∑x i
x= i =1
.
n
x =
2 3 4 5 6 7 8 9
El punto de equilibrio es 5.
Nota: No debe pensarse por la figura que el valor medio tiene que ser un valor
en el conjunto de datos.
En ocasiones muchas observaciones comparten valores comunes, como en las
distribuciones de frecuencia no agrupada. Suponga que tenemos la muestra de
las edades de 10 alumnos del quinto semestre del CCH Oriente:
x=
Para encontrar ∑ x , es más simple sumar los cuatro productos 4(16), 3(17),
2(18), 1(21). Cada producto puede escribirse como fx , donde f es la
frecuencia con que aparece una edad x (vea la tabla de abajo); la suma de los
valores de f es igual a n y la suma de los valores de fx es igual a ∑ x .
x f fx
16 4 64
17 3 51
18 2 36
19 1 19
Total 10 170
Tabla de frecuencias
x=
∑f x
∑f
Definición. La mediana de un conjunto de datos es el valor que se encuentra
en medio de los datos ordenados de menor a mayor (o de mayor a menor) en
caso de haber un número impar de datos. En el caso de un conjunto con un
número par
Notación: ~
x de datos, la mediana es la semisuma de los dos datos centrales.
⎧ x( n +1) / 2 si n es impar
⎪
x%= ⎨ xn / 2 + x( n / 2) +1
⎪ si n es par
⎩ 2
Ejemplo 8. El número de barcos extranjeros que arriban al puerto de Veracruz
en 7 días seleccionados al azar, fueron 8, 3, 9, 5, 6, 8 y 5. Obtenga la mediana.
x%= miligramos.
La moda es una medida de tendencia central que difiere de la media, pero que
se parece un poco a ella porque realmente no se calcula por medio de los
procesos ordinarios de la aritmética.
Definición. La moda de un conjunto de datos es el dato que más se repite. La
moda puede no ocurrir, y cuando existe no es necesariamente única.
Notación: x̂
Ejemplo 10. Las siguientes son las cantidades de tiempo (en minutos) que 16
personas pasaron formadas en una fila para comprar boletos para un concierto:
8, 2, 9, 1, 16, 5, 7, 11, 9, 1, 14, 12, 9, 10, 8 y 4. Determina la moda.
Solución. Una revisión de las cantidades revela que el 9 aparece con más
frecuencia (tres veces) que cualquier otra cantidad. Por lo tanto, el valor modal
es 9 minutos.
Ejemplo 11. El número de películas vistas el mes pasado por una muestra
aleatoria de 12 estudiantes de bachillerato fueron como sigue: 2, 0, 3, 1, 2, 4, 2,
5, 4, 0, 1 y 4. Encuentra la moda.
Solución. En este caso, existen dos modas, 2 y 4, ya que 2 y 4 ocurren con la
mayor frecuencia (3 veces). Se dice entonces que la distribución es bimodal.
Solución. No existe moda para los contenidos de alquitrán, puesto que cada
valor ocurre sólo una vez.
Actividad 6
EJERCICIOS
1. Se pidió a 15 estudiantes del CCH Oriente seleccionados aleatoriamente,
que dijeran el número de horas que habían dormido la noche anterior. Los
datos resultantes fueron: 5, 6, 6, 8, 7, 7, 9, 5, 4, 8, 11, 6, 7, 8, 7. Obtenga:
a) la media b) la mediana c) la moda
IC f
22 - 32 1
33 - 43 2
44 - 54 5
55 - 65 2
66 - 76 9
77 - 87 9
88 - 98 10
99 - 109 5
110 - 120 3
121 - 131 4
Distribución de frecuencias de 50 calificaciones.
f x
Solución. Para poder utilizar la fórmula x = ∑ de la media, debemos
∑f
considerar a x como las marcas de clase. Consideremos ahora la siguiente
tabla, para calcular la media.
IC f x (Marcas de clase) fx
22 - 32 1 27 27
33 - 43 2 38 76
44 - 54 5 49 245
55 - 65 2 60 120
66 - 76 9 71 639
77 - 87 9 82 738
88 - 98 10 93 930
99 - 109 5 104 520
110 - 120 3 115 345
121 - 131 4 126 504
Distribución de frecuencias agrupadas.
x=
∑ f ⋅x =
∑f
Nota: La media tiene una seria desventaja, se ve afectada por los datos que
contienen uno o dos valores sumamente grandes o muy pequeños, por lo que
la media en estos casos puede no ser representativa.
IC f
10 - 19 5
20 - 29 19
30 - 39 10
40 - 49 13
50 - 59 4
60 - 69 4
70 - 79 2
Total 57
La pregunta ahora es: ¿Qué tanto debe avanzarse en este intervalo para
alcanzar a la mediana? Bajo la hipótesis de que los valores están distribuidos
uniformemente a lo largo de todo el intervalo, parece razonable que se debe
avanzar una distancia igual a 5/10 = ½ de la distancia total del intervalo de
clase, puesto que, después de alcanzar el límite inferior del intervalo de clase
que contiene a la mediana, se necesitan cinco observaciones más, y hay un
total de 10 observaciones en el intervalo. Entonces, el valor de la mediana es
igual al valor del límite real inferior del intervalo que contiene a la mediana, más
5/10 de la amplitud del intervalo, es decir,
O también la fórmula:
⎡ n ⎤
⎢ 2 − ( ∑ f )1 ⎥
Mediana = x%= L1 + ⎢ ⎥ c
⎢ f mediana ⎥
⎣ ⎦
donde
L1 = El límite real inferior del intervalo que contiene a la mediana.
(∑ f ) 1
= Suma de las frecuencias de todas las clases por debajo de la
clase mediana.
f mediana = Frecuencia de la clase mediana.
c = Amplitud del intervalo que contiene a la mediana.
n = Número de datos totales.
Producción diaria f
No. piezas
80 - 89 5
90 - 99 9
100 - 109 20
110 - 119 8
120 - 129 6
130 - 139 2
Considerando que los límites reales de clase son 79.5 - 89.5, 89.5 - 99.5 y así
sucesivamente, determina la mediana de la producción diaria.
R S
15
P
T
Q
10
Moda = x = 77
Cuarto, trazando una línea perpendicular al eje horizontal por el punto P donde
se cruzan las líneas dibujadas en los pasos segundo y tercero.
Li = Límite real inferior de clase de la clase modal (la clase que contiene la
moda)
∆1 = frecuencia de la clase modal menos la frecuencia de la clase contigua
inferior.
∆2 = frecuencia de la clase modal menos la frecuencia de la clase contigua
superior.
c = amplitud del intervalo que contiene a la moda.
Li = 69.5, ∆1 = 6, ∆2 = 2 y c = 10.
Ejemplo 16. Las edades de los residentes del fraccionamiento “Los girasoles“
están descritas por la distribución siguiente:
Edades f
27 - 32 4
33 - 38 9
39 - 44 13
45 - 50 42
51 - 56 39
57 - 62 20
63 - 68 9
Li = 44.5, ∆1 = 29, ∆2 = 3 y c = 6.
Actividad 10.
1. La tabla siguiente contiene una muestra de la producción diaria de aparatos
de comunicación de la compañía “ X ”.
Producción diaria
Frecuencias
No. piezas
80 – 89 5
90 – 99 9
100 – 109 20
110 – 119 8
120 - 129 6
130 - 139 2
Determina:
a) La media
b) La mediana.
c) La moda
d) ¿Cuál medida de tendencia central usarías para determinar el valor
central? Explica.
EJERCICIOS
Edades f
18 2
19 3
20 5
21 4
22 1
2. Parece ser que una máquina automática que llena recipientes está
trabajando de manera errónea. Una verificación de los pesos del contenido
de un cierto número de latas reveló lo siguiente:
Peso f
(en grs.)
130 – 139 2
140 – 149 8
150 – 159 20
160 – 169 15
170 – 179 9
180 – 189 7
190 – 199 3
200 – 209 2
Edades f
18 – 20 4
21 - 23 8
24 – 26 11
27 – 29 20
30 - 32 7
3 4 5 6 7 8 9 10
máximo
mínimo
Rango
Ejemplo 18. Calcula la desviación de los puntajes para los datos siguientes,
que representan el número de defectos encontrados por un inspector de autos
en una línea de ensamblaje en los últimos cinco autos producidos: 6, 3, 8, 3, 5.
Datos x 6 3 8 3 5
Desviación x−x 1 -2 3 -2 0
10 Desviaciones
1 0 Media = x = 5
5
-2 -2
1 2 3 4 5 No. de Inspección
∑(x − x ) = 0 .
Para describir el valor “promedio” de estas desviaciones podría usarse la
desviación media, es decir, la suma de las desviaciones divididas entre n . Sin
embargo, como la suma de las desviaciones es cero, la desviación media
también es cero.
Una forma de eliminar que las sumas de las desviaciones sean cero es
considerar el valor absoluto de ellas.
varianza muestral =
2
Nota. El numerador de la varianza de la muestra, ∑ (x − x ) a menudo se
denomina “la suma de cuadrados de x ” y se simboliza SC ( x) . Así la fórmula de
la varianza se puede expresar como
SC ( x)
s2 = , donde SC ( x) = ∑ ( x − x )2
n −1
Las fórmulas de la varianza pueden modificarse a otras formas para aplicarlas
más fácilmente en diversas situaciones.
Es fácil comprobar que
2
SC ( x) = 2
-
(∑ x) .
∑x n
Luego,
2
2 (∑ x) 2
SC ( x) ∑x −
n n∑ x 2 − ( ∑ x )
s2 = = = .
n −1 n −1 n(n − 1)
Ejemplo 19. Los pesos (en gramos) del contenido de varios pequeños frascos
de aspirina son: 2, 5, 4, 5, 2 y 6. ¿Cuál es la varianza muestral?
x=
∑ x = 24 = 4.
n 6
Pesos en gramos x−x ( x − x )2
2 -2 4
5 1 1
4 0 0
5 1 1
2 -2 4
6 2 4
s2 =
∑ (x − x ) =
14
= 2.8
n −1 5
Usando la fórmula más directa:
Pesos en gramos x2
2 4
5 25
4 16
5 25
2 4
6 36
2
(∑ x) (24)2
∑ x2 −
n
110 −
6 = 110 − 96 = 2.8
s2 = =
n −1 6 −1 5
EJERCICIOS
112 96 111
108 115 109
114 125 113
100 120 112
116 94 105
No. de ponches
Juego Luís Manuel
1 4 8
2 3 9
3 9 12
4 16 6
5 12 10
6 10 9
Si los datos que nos interesan están en forma agrupada (en una distribución de
frecuencias), la variancia puede obtenerse al sustituir ∑ ( x − x ) 2 por
2
o al sustituir ∑ f x 2 por ∑ x 2 y ∑ f x por ∑ x .
∑ f (x − x)
Recuerda que para datos no agrupados, una fórmula para la varianza muestral
es:
2
2
(∑ x )
2
∑x −
n
s =
n −1
y con el cambio mencionado anteriormente, la fórmula para la varianza de los
datos que están en forma agrupada se convierte entonces en:
2
(∑ f ⋅ x ) 2
∑ f ⋅x − n
s2 = .
n −1
x 10 15 17 20 22
f 1 3 5 2 4
xi fi f i ⋅ xi xi2 f i ⋅ xi2
10 1 10 100 100
15 3 45 225 675
17 5
20 2
22 4
s 2
=
∑ f (x − x )
n −1
en donde :
x es la marca de clase
f es la frecuencia de clase
n es el número total de observaciones en la muestra.
Otra fórmula para la variancia muestral, sin que intervenga la media, es:
2
(∑ f ⋅ x ) 2
∑ f ⋅ x −
s2 = n
n −1
Se te sugiere que utilices la primera fórmula para calcular la varianza.
Límites de clase
Duración (hrs.) Frecuencia
500 – 599 3
600 – 699 7
700 – 799 14
800 – 899 28
900 – 999 64
1000 – 1099 57
1100 – 1199 23
1200 – 1299 13
1300 – 1399 7
1400 – 1499 4
a) Calcula la varianza
b) Calcula la desviación estándar
EJERCICIOS
Clase
No. de cheques Frecuencia
0 – 199 10
200 – 399 13
400 – 599 17
600 – 799 42
800 – 999 18
Antigüedad f
2–4 2
5–7 5
8 – 10 10
11 – 13 4
14 – 16 2
s
CV= (100) .
x
3.3 5.3
(100) = 5.22% y (100) = 6.72%
63.2 78.8
Al interpretar se puede ver que existe mayor dispersión relativa con respecto a
la media en la distribución de las calificaciones que en la distribución de años
de servicio.
Escribe tu conclusión:
EJERCICIOS
1. Los pesos del equipo “X” tienen una media de 112 kgs, con una desviación
estándar de 9 kgs, mientras que el peso medio y la desviación estándar de
su oponente, el equipo “Y”, son 97.5 y 6 respectivamente. ¿Cuál de los dos
equipos muestra la mayor dispersión relativa en el peso de los miembros
del equipo?
1. El intervalo x ± s contendrá aproximadamente 68% de las observaciones.
2. El intervalo x ± 2s contendrá aproximadamente 95% de las observaciones.
3. El intervalo x ± 3s contendrá casi la totalidad de las observaciones (99.7%).
68% 95%
99.7%
En forma condensada
68%
95%
99.7%
6. LA REGLA EMPÍRICA.
Hemos visto que una desviación estándar pequeña para un conjunto de datos
indica que éstos se encuentran localizados cerca de la media. Por el contrario,
una desviación estándar grande revela que las observaciones están más
dispersas con respecto a la media. También sabemos que nos ayuda a
comparar la variabilidad de un conjunto de datos con otro. Esta “medida”
particular puede comprenderse mejor al examinar el teorema de Chebyshev y
la regla empírica. En este tema solamente estudiaremos la regla empírica, que
como veremos, para una curva de distribución simétrica en forma de campana,
podemos ser más precisos al explicar la dispersión con respecto a la media.
68%
95%
99.7%
Solución.
1. Aproximadamente el 68 % de las cantidades están entre $1 300 y $ 1 700,
cuyos valores se obtuvieron de x ± s = 1 500 ± 200.
2. Aproximadamente el 95% están entre $1 100 y $ 1 900, cuyos valores se
obtuvieron de x ± 2s = 1 500 ± 2(200).
3. Aproximadamente todos los casos (99.7%) están entre $900 y $2 100, que
se obtuvieron mediante x ± 3s = 1 500 ± 3 (200).
1 6 3 5 5 3 4 1 2 7
3 2 3 4 5 3 1 3 2 1
4 4 2 2 3 9 4 3 3 5
3 5 7 3 1 1 3 5 2 6
4 3 3 3 3 3 2 3 4 3
5 7 3 2 1 2 3 2 4 3
Solución.
a) Completa la siguiente distribución:
No.
hermanos
1 2 3 4 5 6 7
Frecuencia
b) x = , s =
c) x - s = , x +s=
d) %
e) x - 2s = , x + 2s =
f) %
g) x - 3s = , x + 3s =
EJERCICIOS
3. Un grupo de sicólogos creen que sería de utilidad para los maestros contar
con cierta prueba que permita medir la coordinación vasomotora, puesto que
está podría dar información interesante sobre los niños que ingresan a la
primaria. La interpretación de los resultados de esta prueba no se ha realizado
en el caso de niños mexicanos, por lo que los sicólogos decidieron que en una
primera etapa de su investigación buscarán ver cómo responden a la prueba
los niños de 6 años de las zonas rurales del centro del país. Con este fin,
escogen una muestra representativa de 200 niños de la edad y la región
mencionadas, a los que les aplican la prueba. Una de las variables de interés
es el tiempo de resolución empleado para cada niño.
35 36 44 49 49 35 49 54 47 49
45 40 41 52 41 47 32 32 34 37
43 38 41 39 42 33 57 52 46 30
36 39 51 33 41 31 40 40 38 51
53 35 38 45 43 36 43 32 43 34
40 38 41 45 53 40 39 50 38 43
47 41 47 52 34 47 51 40 32 44
40 38 43 33 32 41 62 46 44 47
27 34 42 37 31 52 37 44 44 45
38 31 41 40 38 49 44 44 37 44
33 30 37 46 36 46 32 51 39 41
41 36 43 48 53 42 30 38 46 38
49 35 37 45 57 43 45 53 48 52
39 44 35 34 37 30 37 37 51 42
46 41 51 53 35 41 41 28 53 40
51 40 45 44 47 44 48 47 37 53
52 38 35 43 44 32 51 48 52 36
37 50 43 42 42 29 31 39 50 34
44 50 43 41 42 45 49 44 35 22
39 33 46 55 41 34 46 47 43 40
Con los datos anteriores contesta las siguientes preguntas.
1. Construye una tabla de frecuencias con 9 intervalos de clase.
2. Construye un histograma.
3. Construye un polígono de frecuencias.
4. Calcula la media.
5. Calcula la desviación estándar.
Determina el porcentaje de datos que caen en los intervalos x ± s, x ± 2s y
x + 3s , usando la regla empírica.
UNIDAD II. DATOS BIVARIADOS Tiempo: 10
horas
APRENDIZAJES
El alumno:
TEMÁTICA
1. Relación entre dos variables.
2. Relación entre dos variables cualitativas.
3. Regresión lineal y correlación.
1. Relación entre dos variables.
Objetivo de la sección:
INTRODUCCIÓN.
Hasta aquí hemos tratado sólo con datos de una variable obtenidos de una
sola medición. Ahora consideraremos datos de dos variables que resultan de
hacer dos clases diferentes de mediciones. Por ejemplo, para medir la estatura
de cada persona en una población, la obtenemos de datos de una variable; un
conjunto de números, cada uno de los cuales representa la estatura de una
persona. Pero para medir la estatura y el peso de cada persona, obtenemos
datos de dos variables; un conjunto de parejas de números que al mismo
tiempo representan la estatura y el peso de cada persona.
Totales por
columna
Totales por
Columna % % 100 %
40%
30%
20%
10%
M F M F
Si No
Cuando los datos bivariados son resultado de dos variables cuantitativas, los
datos suelen expresarse como parejas ordenadas ( x, y ) donde x es la
variable de entrada (variable independiente) y y es la variable de salida
(variable dependiente).
65
60
55
50
45
EJERCICIOS
d. Elabora una tabla cruzada de las variables “edad del cliente” (usa las
categorías, menos de 35, 35 – 50, más de 50) y “compró (sí/no).
e. Expresa la tabla de contingencia del inciso d como porcentajes basados
en el gran total.
f. Elabora una gráfica de barras que muestre los resultados del inciso e.
x 163 163 167 165 161 163 161 164 162 163 164
y 163 165 165 165 164 164 163 162 163 164 164
x 163 164 164 164 163 167 161 165 164 165 166
y 164 165 165 165 162 166 162 163 166 166 165
a. Usa la misma escala para trazar dos gráficas de puntos que muestren
los dos conjuntos de datos, uno al lado del otro.
b. ¿Qué puede concluir al observar los dos conjuntos de estaturas
mostrados como conjuntos ajenos de esta manera? Explica tu
respuesta.
c. Elabora un diagrama de dispersión para los dos conjuntos de estaturas
y escríbelos como parejas ordenadas.
d. ¿Qué puede concluir al observar los datos como parejas ordenadas?
Explica tu respuesta.
Objetivo de la sección:
• Conoce e interpreta los conceptos de regresión y correlación lineal simple.
• Calcula e interpreta los valores estimados de la pendiente y la ordenada al
origen de la recta de mínimos cuadrados.
• Grafica la recta de regresión.
• Calcula e interpreta el coeficiente de correlación lineal simple.
• Utiliza la recta de ajuste para predecir valores de alguna de las variables.
INTRODUCCIÓN.
La regresión y la correlación son las dos herramientas estadísticas más
poderosas y versátiles que se pueden utilizar en la mayoría de las ciencias
aplicadas, gran parte de la investigación trata de descubrir relaciones entre
variables o conjuntos de variables. Por ejemplo, los fisiólogos pueden
investigar la relación entre el tiempo que le toma a una persona reaccionar y el
nivel de alcohol en la sangre. El economista o el hombre de negocios puede
buscar aquellos factores más estrechamente relacionados con las altas y bajas
del mercado o de la economía. Tal información permite al investigador que
haga conjeturas sobre relaciones de causa a efecto que pueden existir entre
las variables.
x (publicidad en miles) 3 4 5 6
Coloca los puntos (3, 100), (4, 120), (5, 140) y (6, 160) en un mismo plano
cartesiano como el que se te muestra a continuación.
200
150
100
50
0 1 2 3 4 5 6 7 x
Observa que los datos muestran una tendencia fuertemente lineal: entre más
grande es la cantidad gastada en publicidad, mayor son las ventas. Se puede
representar en forma matemática tal tendencia lineal por:
y = A + Bx
x (publicidad en miles) 3 4 5 6
En general, es difícil hallar una fórmula para ajustar los datos exactamente.
Debemos estar satisfechos con una fórmula que sea una buena aproximación
a los datos. Si graficas la recta y = 40 + 20 x en donde graficaste los puntos de
datos de la tabla 2, te darás cuenta que no todos caen sobre la recta pero es
una buena aproximación.
Determina ahora otra ecuación que también se aproxime a los puntos de datos.
La recta de regresión
¿Hay una recta que se ajuste mejor a los datos de la tabla 2 que la recta
y = 40 + 20 x ? Si es así, ¿cómo la encontramos? El proceso de ajustar una recta
a un conjunto de datos recibe el nombre de regresión lineal y la recta de
mejor ajuste se denomina recta de regresión. Numerosas calculadoras (con el
programa LR) y programas de computadora (por ejemplo SPSS) calculan la
recta de regresión a partir de puntos de datos. Alternativamente, la recta de
regresión se puede estimar al trazar los puntos sobre papel cuadriculado y
ajustar una recta “a simple vista”. Por ejemplo, grafica la recta de regresión
y = 54.5 + 16.5 x para los puntos de datos de la tabla 2.
Ahora que tenemos una fórmula para las ventas, podemos usarla para hacer
pronósticos. Por ejemplo para pronosticar ventas totales si se gastan $3,500 en
publicidad, sustituimos x = 3.5 en la recta de regresión:
Con frecuencia, la forma más fácil de ajustar una recta a un conjunto de datos
es trazar una gráfica de los puntos de datos y luego ajustar la recta “a simple
vista”, pero es más preciso hacer que una calculadora o un software de
estadística den la recta de mejor ajuste. ¿Cómo determina una calculadora o el
software cuál recta es mejor?
EJERCICIOS
Edad x 65 67 69 71 73 75 77 79 81 83
Años
Restantes y 16.5 15.1 13.7 12.4 11.2 10.1 9.0 8.4 7.1 6.4
3. La acidez de una solución se mide por su pH , donde los valores más bajos
del pH indican más acidez. Se emprendió un estudio de lluvia ácida en
Colorado entre 1975 y 1978, en el que la acidez de la lluvia se midió
durante 150 semanas consecutivas. Los datos siguieron un patrón
generalmente lineal y se determinó que la recta de regresión era
P = 5.43 − 0.0053t
INTRODUCCIÓN.
El propósito del análisis de regresión es determinar una recta que se ajuste a
los datos muestrales mejor que cualquier otra recta que pueda dibujarse, la
recta del mejor ajuste se encuentra aplicando el método de mínimos
cuadrados. Suponga que
ŷ = A + Bx
( x, $
y) ŷ = A + Bx
y−$
y
$
y ( x, y )
y
x 3 2 4 1
y 2 3 2 5
2
Calculemos la suma de cuadrados de los errores ∑( y − yˆ ) para alguna recta,
digamos $ y = −2 + 2 x dibujada en el diagrama de dispersión e ilustrada en la
figura 3.
Figura 3. Diagrama de dispersión que muestra la recta $
y = −2 + 2 x .
x y $
y y−$
y (y − $
y)2
3 2 4 -2 4
2 3 2 1 1
4 2 6 -4 16
1 5 0 5 25
∑ ( y − yˆ ) = -2 + 1 – 4 + 5 = 0
Y la suma de los cuadrados de los errores:
2
SCE = ∑( y − yˆ ) = 4 + 1 + 16 + 25 = 46
Por lo tanto, para la recta representada por $
y = −2 + 2 x , SCE = 46.
∑ ( x − x )( y − y )
Pendiente: B = 2
∑ (x − x )
Ordenada al origen = A =
∑ y − ( B∑ x )
n
Para determinar la pendiente B se usará la siguiente notación y sus
equivalencias:
x y
SC( xy ) = ∑ ( x − x ) ( y − y ) = ∑ xy − ∑ ∑
n
2
y SC( x ) = 2 2 (∑ x)
∑(x − x ) = ∑ x −
n
Luego,
SC ( xy )
Pendiente: B =
SC ( x)
1 2 3 4 5 6 7 8 9 10
Lagartijas ( x ) 27 22 15 35 30 52 35 55 40 40
Sentadillas ( y ) 30 26 25 42 38 40 32 54 50 43
50
40
30
20
10
0 10 20 30 40 50 60 x
SC ( x ) = 2 (∑ x) =
∑x −
n
x y
SC ( xy ) = ∑ xy − ∑ n∑ =
SC ( xy )
B= =
SC ( x)
A=
∑ y − ( B∑ x ) =
n
OBSERVACIONES
3. La recta del mejor ajuste siempre pasa por el punto ( x, y ) . Al trazar esta
recta en el diagrama de dispersión, usa este punto como comprobación.
Para la actividad 4, x = 35.1, y =38; en consecuencia, ( x, y ) = (35.1, 38).
EJERCICIOS
x 2 12 4 6 9 4 11 3 10 11 3 1
y 4 8 10 9 10 8 8 5 10 9 8 3
x 13 12 14 7 2 8
y 9 8 8 11 6 9
¿Estaría justificado aplicar las técnicas de regresión lineal a estos datos para
encontrar la recta de mejor ajuste? Explica tu respuesta.
Antigüedad ( x ) 6 7 1 3 6 4 5 2 1 9 3 8 9 8
Años
Costo de mant. y 142 231 73 90 176 132 167 99 114 191 160 155 231 202
y y
0 r =1 x 0 r = −1 x
y y
0 r ≈0 x
r = ∑ ( x − x )( y − y )
(n − 1) sx s y
SC ( xy)
r =
SC ( x) SC ( y)
Recuerda que
2
(∑ x) x y
SC ( x ) = ∑x 2
−
n
, SC ( xy ) = ∑ xy − ∑ n∑ y SC ( y ) =
2
2 (∑ y )
∑y −
n
2 2
SC ( x ) = 2 (∑ x) = 13,717 -
(351) = 1,396.9
∑x −
n 10
2 2
SC ( y ) = 2 (∑ y )
= 15, 298 - = 858
( 380 )
∑y n
−
10
x y
SC ( xy ) = ∑ xy − ∑ ∑ = 14,257 -
(351)(380 ) = 919
n 10
Luego,
SC ( xy) 919
r = = = 0.8394 ≈ 0.84.
SC ( x) SC ( y) (1396.9)(858)
Calorías ( x ) 270 420 210 450 130 310 290 450 446 640
Grasas ( y ) 9 20 10 22 6 25 7 20 20 38
y 11 55 6 20 12 36 28 22
SC ( x ) = 2 (∑ x) =
∑x −
n
2
SC ( y ) = 2 (∑ y )
=
∑y −
n
x y
SC ( xy ) = ∑ xy − ∑ ∑ =
n
SC ( xy)
r = =
SC ( x) SC ( y)
EJERCICIOS
Admisión ( x ) 36 51 55 48 62 40 63 35 45 56
Eficiencia ( y ) 72 99 95 81 83 57 82 78 75 92
x 13 97 16 45 20 44 21 96 77 53
y 89 12 64 59 15 22 91 57 84 75
Familia
Medición 1 2 3 4 5
Gasto ( x ) 47 53 57 34 72
Ingreso ( y ) 49 45 48 37 62
x 0 3 2 2 1 3 2 4 1 1
y 25 80 45 40 36 75 50 95 30 15
SC ( x)
r= A
SC ( y )
x 4 3 2 3 0
y 11 8 6 7 4
EJERCICIO
De la siguiente serie de experimentos clasifica si es aleatorio (escribiendo una
A) o determinístico (escribiendo una D).
De entre los enfoques que se pueden dar a esta teoría, empezaremos con el
enfoque “frecuencial”, el cual nos permite utilizar los conceptos estudiados en
la unidad 1. El enfoque frecuencial de la probabilidad es el más adecuado para
las aplicaciones; entre otras cosas, nos permite dar una interpretación directa
de lo que llamaremos: “la probabilidad de un evento”.
No. de exp. 1 2 3 4 5 6 7 8 9 10
Resultado
No. de serie 1 2 3 4 5 6 7 8 9 10
Frec. relativa
No. de serie 11 12 13 14 15 16 17 18 19 20
Frec. relativa
EL MODELO SUBJETIVO
EL MODELO CLÁSICO
Cuando lanzamos un dado no cargado, cualquiera de sus seis caras puede
mostrarse hacia arriba. Es costumbre, cuando usamos el enfoque clásico para
asignar probabilidades de un sexto a cada una de las caras, bajo la hipótesis
de que cada una tiene una oportunidad igual de quedar hacia arriba.
En esta unidad, con frecuencia asignaremos probabilidades de acuerdo con el
enfoque clásico, porque el muestreo aleatorio tiene validez para suponer que
los sucesos posibles del muestreo son igualmente probables.
EJERCICIO
No. de serie 1 2 3 4 5 6 7 8 9 10
Frec. relativa
No. de serie 11 12 13 14 15 16 17 18 19 20
Frec. relativa
Moneda
Moneda 2 s a
1
s ss sa
a as aa
Solución. Los dados que tenemos en mente son los que tienen seis caras,
supongamos que los llamamos dado 1 y dado 2, de esta manera los posibles
resultados que tenemos son:
Dado1 1 2 3 4 5 6
Dado 2 1 11 12 13 14 15 16
2 21 22 23 24 25 26
3 31 32 33 34 35 36
4 41 42 43 44 45 46
5 51 52 53 54 55 56
6 61 62 63 64 65 66
s ss
s
a sa
1 a1
2 a2
a 3 a3
4 a4
5 a5
6 a6
En forma de lista
S = {(s, s), (s, a), (a, 1), (a, 2), (a, 3), (a, 4), (a, 5), (a, 6)}
EJERCICIOS
E1 = {ss}, E2 = {as}, E3 = {sa}, E4 = {ss, aa}, E5 = {as, sa}, E6 = {ss, as, sa}
4. Para el experimento de lanzar los dos dados del ejercicio 3, lista los
resultados de los eventos siguientes:
a) La suma es par.
b) La suma es divisible entre 5.
c) La suma es un número primo.
d) El número del dado negro es dos unidades mayor que el número del
dado rojo.
e) La suma es impar.
f) La suma no es divisible exactamente entre 5.
Operaciones entre eventos
A B
El evento A I B
Espacio muestral
Solución. A = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}, B = {(3, 4), (4, 3), (5, 2),
(2, 5), (6, 1), (1, 6)}. Luego, A I B = {(4, 3)}.
A B
El evento A U B
Espacio muestral
El evento AC
Espacio muestral
Ejemplo 11. Sea A el evento de seleccionar una carta roja de una baraja
común de 52 cartas y sea S el total de la baraja. Entonces, AC es el evento de
que la carta seleccionada de la baraja no sea roja sino negra.
Ejemplo 12. Suponga que se lanzan dos dados y que se observa el número de
la cara superior de cada lado. Sea S el conjunto de todos los pares posibles
que pueden observarse, defina los siguientes eventos de S :
A : El número en el segundo dado es par.
B : La suma de los dos números es par.
C : Al menos un número en el par ordenado es impar.
Determina
a) A
b) B
c) C
d) A I B
e) A U B
f) C C
g) A I BC
h) AC I C .
Solución.
a) A = {(1, 2), (1, 4), (1, 6), (2, 2), (2, 4), (2, 6), (3, 2), (3, 4), (3, 6), (4, 2),
(4, 4), (4, 6), (5, 2), (5, 4), (5, 6), (6, 2), (6, 4), (6, 6)}.
b) B = {(1, 1), (1, 3), (1, 5), (2, 2), (2, 4), (2, 6), (3, 1), (3, 3), (3, 5), (4, 2),
(4, 4), (4, 6), (5, 1), (5, 3), (5, 5), (6, 2), (6, 4), (6, 6)}.
c) C = {(1,1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 3), (2, 5), (3, 1),
(3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 3), (4, 5), (5, 1), (5, 2), (5, 3),
(5, 4), (5, 5), (5, 6), (6, 1), (6, 3), (6, 5)}.
d) A I B = {(2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6)}.
e) A U B = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 4), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 2), (4, 4), (4, 6), (5, 1), (5, 2),
(5, 3), (5, 4), (5, 5), (5, 6), (6, 2), (6, 4), (6, 6)}.
f) C C = {(2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6)}.
i) A I BC = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6), (5, 2), (5, 4), (5, 6)}.
j) AC I C = C .
EJERCICIOS
1. Suponga que en una familia hay dos niños de diferente edad y que nos
interesa conocer cuál es su sexo. Sea A el evento de todas las
posibilidades que no incluyen varones; B el evento que contiene dos
varones, y C , el evento que contiene al menos un varón. Lista los
elementos de los siguientes eventos:
a) A b) C C c) A I B d) A U B e) A I BC f) AC I B g) AC I C
Cálculo de probabilidades
Si hay únicamente un evento simple que pueda ocurrir, éste tiene una
probabilidad de 1. Si un evento simple particular no puede ocurrir nunca, tiene
una probabilidad igual a 0.
Cuando un espacio muestral contiene eventos simples igualmente probables,
asignamos a cada evento simple una participación igual de la probabilidad total
igual a 1. En otras palabras, si hay N eventos simples en el espacio muestral,
1
asignamos la probabilidad para cada uno de estos eventos simples.
N
Ejemplo 13. Al lanzar una moneda balanceada, asignamos una probabilidad
1
de a cada uno de los puntos en el espacio muestral S = {sol, águila}.
2
Ya que casi siempre trataremos en este libro con experimentos que producen
eventos simples igualmente probables, adoptaremos la siguiente notación para
simplificar la discusión y para ilustrar los cálculos de probabilidad. Sea η( A)
asignado para el número de eventos simples en el evento compuesto. Sea
η( S ) quien designa el número de eventos simples en el espacio muestral S .
Entonces, suponiendo que los eventos simples son igualmente probables,
nombramos la probabilidad de un evento A como
n( A)
P ( A) = .
n( S )
Calcula: a) P ( A) b) P ( B )
EJERCICIOS
5. Una caja contiene tres canicas azules, cuatro amarillas y dos verdes; se
elige una canica al azar. ¿Cuál es la probabilidad de que la canica resulte:
a) azul? b) amarilla? c) verde?
Estado civil
Sexo Casado Soltero Divorciado Viudo
Hombre 25% 11% 10% 3%
Mujer 30% 8% 7% 6%
INTRODUCCIÓN
Las técnicas de conteo juegan un papel importante en diversas áreas, tales
como probabilidad, estadística y ciencias de la computación. En esta sección
estudiaremos algunos problemas especiales de conteo, posteriormente
obtendremos algunas fórmulas generales que nos permitirán resolverlos con
cierta facilidad. Un ejemplo sería, si planeas tus vacaciones y deseas encontrar
la manera más económica de viajar de un lado a otro, debes empezar por
determinar cuántas rutas distintas de viaje existen. Otro ejemplo, Servicios
Escolares del Colegio querría conocer el número de diferentes maneras en que
un estudiante puede inscribirse en el quinto semestre.
Solución. Puede elegir el idioma de 5 maneras y, por cada una de ellas, hay 4
formas de elegir la materia de historia. Por lo tanto, el número posible de
resultados es
5 (4) = 20
A C BAC
Inicio B
C A BCA
A B CAB
C
B A CBA
Ejemplo 5. En cierto estado, las licencias para pescar están identificadas con
un código que consiste en dos letras seguidas por tres dígitos, en donde se
permite que se repitan las letras y los dígitos. ¿Cuántas licencias pueden
emitirse si cada licencia tiene un código diferente?
26(25)(10)(9)(8) = 468,000.
Ejemplo 6. ¿Cuántos números pares de tres dígitos se pueden formar con los
números 1, 2, 5, 6 y 9, si sólo es posible utilizar cada uno de éstos una sola
vez?
Solución. Puesto que el número debe ser par, sólo se tienen n1 = 2 alternativas
para la posición de las unidades. Para cada una de éstas se tienen n2 = 4
alternativas para la posición de las centenas y n3 = 3 alternativas para la
posición de las decenas.
Por lo tanto, se puede formar un total de n1 (n2 )(n3 ) = 2(4)(3) = 24 números
pares diferentes de tres dígitos.
Solución. Para formar números mayores que 500, se deben hacer tres
elecciones: el dígito de las centenas, el de las decenas y el de las unidades. En
la primera elección se escoge un dígito mayor o igual a 5 y en las decenas y
unidades cualesquiera de los otros dígitos. Podemos imaginar que las distintas
elecciones son cuadros:
6. ¿Cuántas placas de auto se pueden hacer usando tres dígitos y tres letras
del abecedario? (Considera los dígitos del 0 al 9 y 26 letras).
4 3 2 1 = 24
n ! = n(n − 1)!
n ! = n(n − 1)(n − 2)!
.
.
.
n ! = n(n − 1)(n − 2)L 2(1) , .
100! (100)(99)(98)!
Solución. = = 100(99) = 9900.
98! 98!
n!
Ejemplo 11. Simplifica .
(n − 2)!
EJERCICIOS 2
Determina el valor de las siguientes expresiones:
10! 12!
1. 7! 2. 3! + 4! 3. 8! – 5! 4. 5.
8! (12 − 3)!
PERMUTACIONES
Una aplicación importante del principio fundamental del conteo consiste en
determinar en cuántas formas pueden arreglarse (en orden) n elementos. A un
orden de n elementos lo llamamos permutación de los elementos.
Ejemplo 12. Algunas de las permutaciones de las letras ABCD son: ABDC,
BACD, ACBD, DCBA,... ¿Cuántas permutaciones son posibles?
Solución. Como hay cuatro alternativas para la primera posición, tres para la
segunda (ya se ha elegido la primera), dos para la tercera (ya se eligieron las
dos primeras) y una para la cuarta, de acuerdo con el principio fundamental del
conteo, la cantidad de permutaciones posibles es
4 (3)(2)(1) = 24 = 4!
Este mismo razonamiento se emplea en el caso general para el número n en
lugar que el caso particular de 4, así se tiene la proposición siguiente:
Ejemplo 14. ¿De cuántas maneras se pueden colocar en una fila 5 hombres y
4 mujeres de forma que ellas ocupen los lugares pares?
10! 10!
10P4 = = = 10 (9)(8)(7) = 5040.
(10 − 4)! 6!
Ejemplo 18. Determina cuántos números hay de 2000 al 2999 que se pueden
formar con los dígitos 1, 2, 3, 4, 5 si los dígitos no se pueden repetir.
n! (n + 1)!
Solución. 10 = ⇒ 10n(n − 1) = (n + 1)n(n − 1)(n − 2)
(n - 2)! (n − 3)!
10 = (n + 1)(n − 2) = n2 − n − 2 = (n + 3)(n − 4) = 0
Por lo tanto, n = 4.
EJERCICIOS 3
1. Calcula:
a) 20P2 b) 8P5 c) 7P5 d) P5
Solución. La lista de todas las combinaciones posibles son: ABC, ABD, ACD y
BCD.
Luego, el número de combinaciones de los 4 objetos tomados 3 a la vez es 4.
P2 12
4 C2 = = 6.
4
=
2 2
Del ejemplo 22 otra vez si nos importara el orden tendríamos que el número de
permutaciones es 4P3 = 24. Pero, como por ejemplo ABC, ACB, BCA, BAC,
CAB y CBA son los mismos, observamos que por cada seis permutaciones
tenemos una combinación. Luego,
4 P3 24
4 C3 = = = 4.
6 6
Pr n!
n Cr = =
n
r ! r !(n − r )!
Ejemplo 23. ¿De cuántas maneras se puede elegir un comité de tres miembros
en un club con 25 miembros?
Ejemplo 26. Una paletería anuncia que se puede elegir cinco diferentes
confetis para aderezar su helado. Puede escoger ninguno, uno, dos, tres,
cuatro o cinco confetis. ¿Cuántas elecciones son posibles en total?
5 C0 + 5 C1 + 5 C2 + 5 C3 + 5 C4 + 5 C5 = 32.
Ejemplo 27. ¿De cuántas formas se pueden repartir 14 películas entre dos
personas, A y B, de manera que a uno le toquen 8 y al otro 6?
Solución. En cada una de las divisiones de las 14 películas en 8 y 6, A recibe
8 y B recibe 6, o bien A recibe 6 y B recibe 8.
Por tanto, el número de formas es:
2 ⋅ 14C8 = 2 ⋅ 14C6 = 2 (3003) = 6006 formas.
Solución.
El número de rectas que forman el decágono es el número de combinaciones
de 10 puntos tomados de 2 en 2 esto es 10C2 = 45 (ya que no hay tres puntos
colineales)
Ejemplo 29. Suponga que una bolsa contiene cuatro pelotas negras y siete
blancas. ¿De cuántas maneras puede sacarse un grupo de tres pelotas de la
bolsa en las combinaciones siguientes?
a) Una pelota negra y dos blancas b) Tres pelotas de un solo color
c) Por lo menos una pelota negra
4 C1 7 C2 = 4(21) = 84 maneras
b) Como las tres pelotas deben de ser del mismo color, tenemos que obtener
las combinaciones de que las tres sean blancas o que las tres sean negras.
Número de pelotas de un solo color 4C3 + 7C3 = 4 + 35 = 39
c) Por lo menos una pelota negra significa que debemos obtener una, dos y
tres negras. De la misma manera que en el inciso a se tiene
Solución. Observa que nCr = nCn - r, por lo que de nC15 = nC11 se obtiene
EJERCICIOS 4
1. Determina el valor de cada expresión
a) 8C3 b) 9C2 c) 11C4 d) 99C3
4!
YXXY, YYXX, XYYX y YXYX. Las cuales se pueden determinar como
= 6.
2! 2!
Observa que esto es una generalización de las combinaciones, más que de las
permutaciones. En efecto, las combinaciones de n en r no son otra cosa que
las permutaciones distinguibles de n objetos, de los cuales sólo hay dos tipos;
a saber: r objetos que son de un tipo (los que se toman) y el resto ( n − r ) de
otro (los que se dejan). En virtud de este hecho, se prefiere emplear una
notación que sugiera que las permutaciones distinguibles son la generalización
natural de las combinaciones:
⎛ n ⎞ n!
⎜ ⎟ =
⎝ n1 ,n2 ,...,nk ⎠ n1!n2!L nk !
Ejemplo 32. ¿De cuántas formas distintas se puede formar una fila de cinco
canicas rojas, dos blancas y siete azules?
14!
= 72072.
5! 2! 7!
Ejemplo 33. Calcula la cantidad de permutaciones distinguibles cuando se
usan todas las letras de la palabra BEGINNING.
Ejemplo 34. ¿Cuántos números diferentes pueden formarse con los dígitos 5,
6, 6, 7, 7, 7, 8, 8?
Solución. Hay 8 dígitos donde uno es 5, dos son 6, tres son 7 y dos son 8.
Luego,
8! 8(7)(6)(5)(4)(3)(2)
8P1,2,3,2 = = = 8(7)(6)(5) = 1680 números diferentes.
1!2!3!2! 1(2)(3)(2)(2)
EJERCICIOS 5
1. ¿De cuántas maneras se pueden formar una fila de dos canicas azules y
cuatro rojas?
3. ¿De cuántas maneras se puede formar una fila con cuatro monedas de $1,
tres de $2, tres de $5 y dos de $10? (Las monedas son indistinguibles)
8. Hay doce bolas en una urna. ¿De cuántas maneras se pueden sacar 3
bolas de la urna, 4 veces sucesivamente, todas sin sustitución?
9. Si se lanzan cuatro dados, ¿de cuántas maneras pueden caer de tal manera
que la suma de sus puntos superiores sea 16?
RESPUESTAS
EJERCICIOS 1. REGLA mn
1. 24 2. 21 3. 60 4. 720 5. 243 6.
17,576,000
7. 240 8. 36 9. 32,292,000 10. 1024
EJERCICIOS 2. FACTORIAL
1. 5040 2. 30 3. 40200 4. 90 5. 1320 6. 252
11
7. 27,720 8. 9 9. 10. a) V b) F c) F d) V
30
EJERCICIOS 3. PERMUTACIONES
1. a) 380 b) 6720 c) 2520 d) 120 2. 720 3. 1320
4. 210 5. 6840 6. 9744 7. a) 79833600 b) 3628800
c) 13305600 8. a) 120 b) 24 c) 48 9. a) 720 b)
1440
10. a) 20 b) 10
EJERCICIOS 4. COMBINACIONES
1. a) 56 b) 36 c) 330 d) 156849 2. 126 3. 2598960
4. $22,957,480 5. 15 6. a) 84 b) 30 7. 180 8. a)
35
b) 120 9. 63 10. a) 2 y 7 b) 8 c) 20
20! 20(19)(18)
η ( S ) = 20C3 = = = 1140
3!17! 6
n( F ) 150 15 5
P( F ) = = = = .
n( S ) 1140 114 38
c) El evento G , “al menos dos son defectuosos”, cuando son seleccionados 3,
es equivalente a requerir que se seleccionen exactamente 2 o exactamente
3. esto es, G = E U F . Como E y F son mutuamente excluyentes (no es
posible seleccionar 2 teléfonos defectuosos y, al mismo tiempo, seleccionar
3 teléfonos defectuosos), encontramos
1 15 16 8
P(G ) = P( E ) + P( F ) = + = = .
1 1 4 1 1 4 1 1 4 57
η ( S ) = 2 ⋅ 2 ⋅ 2 ⋅ 2 ⋅ 2 ⋅ 2 = 26 = 64
n( A) 6 3
P( A ) = = =
n( S ) 64 32
Solución. a) Método 1.
Sean R1, R2 y R3 los eventos, “bola roja en la primera extracción”, “bola roja en
la segunda extracción”, “bola roja en la tercera extracción”, respectivamente.
Así R1 ∩ R2 ∩ R3 representa el evento “las 3 bolas extraídas son rojas”. De
esta manera tenemos
P(R1 ∩ R2 ∩ R3) = P(R1) P(R2|R1) P(R3| R1 ∩ R2 )
8 ⎞ ⎛ 7 ⎞ ⎛ 6 ⎞ 1 4
= ⎛⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = .
⎝ 20 ⎠ ⎝ 1 9 ⎠ ⎝ 1 8 ⎠ 285
Método 2.
&
numero de grupos de 3 bolas entre 8 rojas
Probabilidad pedida =
&
numero de grupos de 3 bolas entre 20
C 1 4
= 8 3 = .
20C3 285
C3 1
P(3 bolas blancas) = 3
=
20C3 1 1 40
4 3 4 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ 288 24
P = ⎛⎜ ⎞⎟ ⎛⎜ ⎞⎟ ⎛⎜ ⎟⎜ ⎟ ⎜ ⎟ = =
⎝ 52 ⎠ ⎝ 51 ⎠ ⎝ 50 ⎠⎝ 49 ⎠ ⎝ 48 ⎠ 31 1,875,200 25,989,600
Como los ases y los reyes se pueden aparecen en cualquier orden entonces el
5!
número de formas que pueden aparecer es 5P2,3 = = 10.
2 !3!
Por lo tanto la probabilidad solicitada es
24 24 1
10 = =
25,989,600 2,598,960 108290
2ª. Solución. El número de formas en que se pueden obtener 2 de 4 ases es
4!
4 C2 = =6
2!2!
4!
4 C3 = = 4.
3! 1 !
Del principio fundamental del conteo, existen n = 6(4) = 24 manos con 2 ases y
3 reyes. El número total de manos de póquer de 5 cartas, todas igualmente
probables, es
52 !
N = 52C5 = = 2,598,960
5! 47 !
Por lo tanto, la probabilidad de obtener 2 ases y 3 reyes en una mano de
póquer de 5 cartas es
24
P= = 0.9 x 10-5.
2,598,960
C3 286 11
P(todos treʹ′boles) = 13
= = .
52 C3 22100 850
d) Hay 4 palos cada uno formado por 13 naipes. Por tanto, hay 4 formas de
que el naipe sea de uno de ellos, y 13C3 maneras de obtener 3 naipes de un
palo dado. Luego,
4 ⋅ 13 C3 4(286) 22
P(todos del mismo palo) = = =
52 C3 22100 425
h( S ) = 36540.
Se define A como el evento de que haya una o más repeticiones del mismo
número en cada 40 – ada. Entonces Ac es la colección de 40 – adas que no
tienen repeticiones; se puede ver con facilidad que:
h( Ac ) = 365 (364) (363) . . . (326) = 365P40
lo que da
n( Ac ) 365(364)(363)...(326)
P( Ac ) = = ≈ 0.109
n( S ) 36540
Como P( A) = 1 − P( Ac ) , se tiene que P ( A) = 1- 0.109 = 0.891.
Ejemplo 8. El número total de papeletas de una rifa es 20. Sabiendo que hay 2
premios, hallar la probabilidad que tiene un individuo que adquiere 2 papeletas
de que le toque a) los dos premios, b) ninguno de ellos, c) uno de los dos.
Solución.
a) El número de casos posibles es 20C2.
1 1
Luego la probabilidad de que le toquen los dos premios es = .
20 C 2 1 90
2 1
Otra solución. La probabilidad de que le toque el primer premio es = .
20 1 0
Después de haber salido el primer premio (él tiene una papeleta y hay 19
papeletas entre las que debe salir el segundo) la probabilidad de que le toque
1
el segundo premio es .
19
1 ⎛ 1 ⎞ 1
Luego la probabilidad de que le toquen los dos premios es ⎜ ⎟ = .
1 0 ⎝ 1 9 ⎠ 1 90
b) Hay 20 papeletas de las cuales 18 no tienen premio.
C2 1 53
Luego la probabilidad de que no le toque premio es 18
=
20 C2
1 90
RESPUESTAS
253 33 28710396
1. a) b) 2. ≈ 0.1293 3. 0.777
9996 66640 2220327131
56 1 36 44 11
4. 5. a) b) c) d)
1024 270725 270725 4165 4165
1 10
6. a) b)
21 21
BIBLIOGRAFÍA