Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Nicolás Pinto P.
Lic. en Ciencias. Mención Matemáticas.
Universidad de Chile.
Ariel Reyes F.
Lic. en Ciencias Exactas.
Universidad de Chile.
7 DISEÑO Y DIAGRAMACIÓN
Nicole Castro B.
Distribución gratuita, prohibida su venta. Lic. en Artes Visuales. Diseñadora (e)
© Todos los derechos reservados. Pontificia Universidad Católica de Chile.
PREFACIO
Este libro fue confeccionado por Mauricio Chiong Ingeniero Civil Industrial(c) de la
Pontificia Universidad Católica de Chile, fundador de la empresa Sacateun7 y Direc-
tor del Preuniversitario Gauss.
Espero que este libro sirva de apoyo para lograr un alto puntaje, entrar a la carrera
que quieren, y cumplir sus sueños
Santiago, 2016
Mauricio Chiong
ÍNDICE GENERAL
Prefacio 4
Nomenclatura 8
1. Estadística 10
Definiciones básicas 11
Gráficos 13
Medidas de posición o tendencia central 15
Medidas de localización 16
Medidas de dispersión 18
Ejercicios 19
2. Probabilidades 34
Definiciones Básicas 35
Combinatoria 35
Probabilidades Clásica y Experimental 36
Distribuciones de Probabilidad 37
Esperanza Matemática 39
Ejercicios 40
Respuestas 51
DEFINICIONES BÁSICAS
7 Población (universo)
Es el conjunto de todos los objetos que estamos estudiando u observando, y quere-
mos hacerle un estudio estadístico.
7 Muestra
Como en general los universos son muy grandes (por ejemplo si estamos estudiando
la raza humana), entonces se toma una porción significativa de ellos para hacer el
estudio más simple. A esta porción se le denomina muestra.
7 Variables
Son características que se le asocian a los objetos de la muestra y que pueden ser
observables o medibles. Las variables se dividen en dos tipos, la primera es la va-
riable cuantitativa que es la que puede ser expresada a través de un número como
por ejemplo la edad o la cantidad de hijos que tiene un individuo, que a su vez se
dividen en discretas y continuas. Las discretas son las que son expresadas a través de
números enteros, mientras que las continuas son expresadas a través de cualquier
número real. El segundo tipo son las variables cualitativas las cuales expresan una
cualidad de un objeto como por ejemplo su tipo de pelo o su sexo, las que se dividen
en ordinales y nominales. Las ordinales son las que pueden ser ordenadas de manera
lógica como por ejemplo el nivel de estudio, mientras que las nominales no pueden
ser ordenadas como las personas por su color de pelo.
7 Tablas de frecuencia
Las tablas de frecuencia sirven para ordenar los datos cuando la muestra es muy
grande y que por ello sería muy poco práctico enlistarlas. Estas pueden ser de dos
tipos, la primera es cuando el recorrido de la variable es pequeño, que lo ilustramos
con el siguiente ejemplo
Ejemplo /
Veremos la cantidad de e-mails que recibe una persona por día
durante un mes, arrojando los siguientes datos
Nº de e-mails Frecuencia
0 2
1 8
2 9
3 8
4 0
5 3
Total 30
7 Frecuencia relativa
Se representa usualmente por hi y es la frecuencia absoluta dividida por el tamaño
de la muestra, por lo que representa la razón entre la cantidad de veces que se repite
un dato y el tamaño muestral.
GRÁFICOS
Como su nombre lo dice, es la forma gráfica de representar una tabla de datos y exis-
ten principalmente tres: Histogramas o gráfico de barras, polígono de frecuencias y
gráfico circular.
7 Histogramas
Los gráficos de barras se montan en ejes coordenados: en el eje X va el recorrido de
las variables (como puntos o intervalos) y en el eje Y va la frecuencia absoluta.
Ejemplo /
Si consideramos la tabla de frecuencias del ejemplo anterior
Tiempo de atraso Frecuencia
0-9 3
10 - 19 7
20 - 29 9
30 - 39 8
40 - 49 0
50 - 59 3
Total 30
9
8
7
0
10 20 30 40 50 60
7 Polígono de frecuencia
Al igual que antes va en ejes coordenados, pero esta vez en el eje de las X marcamos
los puntos medios de los intervalos considerados (representante del intervalo) y en
el eje de las Y las frecuencias. Luego marcamos los puntos de la forma (representante
del intervalo, frecuencia del intervalo) y los vamos uniendo por una línea.
Ejemplo /
Usaremos la misma tabla de frecuencias del ejemplo anterior,
y obtendremos el siguiente polígono de frecuencia,
9
8
7
0
10 20 30 40 50 60
7 Gráfico circular
A diferencia de los anteriores, este no utiliza la frecuencia absoluta si no que la fre-
cuencia relativa, asociando la porción de un disco circular correspondiente a su fre-
cuencia relativa.
Ejemplo /
Tomemos la tabla de frecuencia anterior y agreguemos la
frecuencia relativa
1
0-9 3
10
10 - 19 7 7
30
20 - 29 9 3
10
4
30 - 39 8
15
40 - 49 0 0
1
50 - 59 3
10
Total 30 1
resultante se ve como
-9
0
20 - 29
10 - 19
30 - 39
Las medidas de posición o de tendencia central son tres: La media aritmética, Me-
diana y Moda. La primera de estas -la media aritmética- es el promedio que usual-
mente conocemos, es decir, la suma de todos los datos divididos por la cantidad total
de ellos, por ejemplo si lo datos son 1, 2, 3 y 4, entonces el promedio es
1 + 2 + 3 + 4 10
= = 2,5
4 4
El segundo de ellos -la mediana- es el valor que divide en dos partes iguales a la
muestra cuando esta se encuentra ordenada ya sea de forma creciente o decreciente.
Por ejemplo, si la muestra es 1, 2, 2, 2, 3, 4, 5, 6, 7, 8 y 9, entonces la mediana es 4,
ya que hacia la izquierda y hacia la derecha de 4 podemos encontrar 5 elementos de
la muestra.
El último de ellos -la moda- es el elemento de mayor frecuencia dentro de una mues-
tra, por ejemplo si la muestra es 1, 2, 2, 2, 3, 3, 4, 5, 6, 7 y 9, entonces claramente
la moda es 2, ya que es el único que tiene frecuencia 3. Debemos tener claro que la
moda no es necesariamente única, puede ser una muestra bimodal o multimodal,
o en caso que todos los elementos presentan la misma frecuencia diremos que la
muestra es amodal o que no posee moda.
MEDIDAS DE LOCALIZACIÓN
Las medidas de localización, como dice su nombre, nos ayudan a saber con alguna
precisión la ubicación de cierto elemento de la muestra. La precisión la dará el ele-
mento de localización que usemos que son básicamente tres: Cuartiles, Deciles y Per-
centiles.
7 Cuartiles
Los cuartiles son tres valores que dividen a un conjunto de datos ordenados en cuatro
partes porcentualmente iguales y denotaremos a esos valores por Qi. Si tenemos una
serie de datos ordenados, entonces una forma de calcular los valores de los cuartiles es
7 Deciles
Son básicamente lo mismo que los cuartiles pero en vez de tres elementos dividen
los datos en 4 partes porcentualmente iguales, son 9 valores que dividen la mues-
tra en 10 partes porcentualmente iguales y los denotaremos por Di. Para su calculo
veremos primero los percentiles y con ellos veremos como a partir de ellos puedo
calcular los cuartiles y deciles.
7 Percentiles
Al igual que los anteriores y como dice su nombre, los percentiles son 99 valores
que dividen a los datos en 100 partes porcentualmente iguales, a los que denotamos
por Pi . Si un dato esta ubicado en el percentil Pi , significa que es mayor o igual ,
aproximadamente, que el i% de la muestra y menor que el 100 − i% de la muestra. La
relación entre los percentiles, deciles y cuartiles es la siguiente
P10 = D1
P20 = D2
P25 = Q1
P30 = D3
P40 = D4
P50 = D5 = Q2 = mediana
P60 = D6
P70 = D7
P75 = Q3
P80 = D8
P90 = D9
Por lo tanto si aprendemos a calcular los percentiles, sabremos calcular los deciles y
los cuartiles. Para el calculo del percentil Pi consideraremos el siguiente valor
n⋅i
x=
100
donde n es el tamaño de la muestra e i el percentil a calcular. Luego si llamamos Observación
E= [x] y D = {x}, entonces la siguiente función nos da el percentil correspondiente Recordemos que [x] es la parte entera
de x y {x} es la parte fraccionaria de x y
Elemento( E + 1) Si D ≠ 0 se calcula x-[x]
Pi = Elemento( E ) + Elemento( E + 1)
Si D = 0
2
Ejemplo /
Suponga que se tiene una muestra ordenada de 200 elementos y
queremos ubicar el percentil número 70, esto es, el elemento que
divide la muestra en dos partes de modo que el 70% de los datos
se ubica por debajo de él (y el resto de la muestra corresponde al
30% mayor). Entonces aplicando la fórmula con n = 200 e i = 70,
obtendremos que 200 ⋅ 70
x= = 2 ⋅ 70 = 140
100
Luego como x resultó ser un número entero, entonces debemos
tomar la segunda rama de la función, es decir, tomaremos el ele-
mento 70 y 71 de la lista, y el promedio resultará ser el percentil
buscado.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son aquellas que nos ayudan a medir qué tan separados
están los datos unos de otros. Los que estudiaremos son tres: Desviación media,
varianza y desviación estándar.
7 Desviación media
Es el promedio de los valores absolutos de las desviaciones, donde las desviaciones
son la diferencia entre un dato (o el representante en caso que estemos viendo inter-
valos) y la media aritmética, es decir,
∑
N
xi − x donde xi es la variable (o el representante en caso de interva-
i=1
Dm
= los), N el tamaño de la muestra y x la media aritmética.
N
7 Varianza
La varianza se denota por σ2 y es la media aritmética de los cuadrados de las desvia-
ciones, es decir,
∑
N
( x i − x )2
σ 2
= i=1
N
7 Desviación estándar
Este concepto se introduce debido a que la varianza esta medida en unidades cua-
dradas y estas pueden ser difíciles de interpretar. Por ello introducimos la desviación
estándar como la raíz cuadrada de la varianza, es decir, σ = σ 2 .
EJERCICIOS
1 2 3 4 5
Número de IPhones
Día Nº de personas
Vie Mié
Lunes 100
Martes 150 Jue
Miércoles 200
Jueves 100 A) Solo I
Viernes 225 B) Solo II
Sábado 200 C) Solo I y II
Domingo 100
D) Solo II y III
E) I, II y III
I.
250
100
Estatura Nº de alumnos
50
148 - 152,9 1
153 - 157,9 5
Lun Mar Mié Jue Vie Sáb Dom 158 - 162,9 11
163 - 167,9 14
250
100 A) 45º
B) 30º
50
C) 20º
D) 12,5º
Lun Mar Mié Jue Vie Sáb Dom E) 8º
6. Si el promedio de las notas finales de un curso 8. De acuerdo con la información entregada por
de 20 alumnos es de 4 y el de otro curso de 30 la tabla, que nos muestra los años de escolaridad
alumnos es de 6, entonces el promedio de notas de menores en situación de abandono, ¿Cuál es la
finales de los alumnos de ambos cursos es mediana de la muestra?
A) 4,2
B) 4,7
Años de Menores Frecuencia
C) 5,2 escolaridad de edad acumulada
D) 5
0 3 3
E) 5,4
1 0 3
2 1 4
3 2 6
4 3 9
5 6 15
Total 15
A) 41
B) 50
C) 61
61
D)
150
E) 45,5
9. Se realiza un estudio sobre el número de días que 10. Si la media aritmética entre a y b es 3 y la
los pacientes sufren mejorías de jaqueca crónica con desviación estándar es 3 , entonces el valor
un nuevo medicamento, presentado en la siguiente de ab es
tabla ¿Cuál(es) de las siguientes afirmaciones
es(son) verdadera(s)? A) 2
B) 4
C) 6
Días Frecuencia
D) 8
0 100 E) 10
1 250
2 300
3 500
4 450
5 2.000
A) Solo I
11. Dado los datos 2, 2, 3, 3, 5, 1, 5, 1, 2, 4, ¿cuál es la
B) Solo II
frecuencia de la moda?
C) Solo I y II
D) Solo I y III
A) 2
E) I, II y III
B) 3
C) 4
D) 5
E) La muestra no posee moda
12. En una balanza, se pesan al mismo tiempo 20 14. Respecto a la tabla de la pregunta anterior,
personas. Si la balanza registra 1.200 kilogramos, ¿Cuál es la moda?
¿Cuál es el peso promedio de estas personas?
A) 7
A) 60 B) 6
B) 40 C) 5
C) 50 D) 4
D) 30 E) 3
E) 20
Nota fi
15. Una serie de camisas de iguales características
3 1
valen $5.000, $8.000, $10.000, $10.000 y $15.000.
4 5
Dados estos datos, ¿Cuál(es) de las siguientes
5 2
características es(son) verdadera(s)?
6 1
7 1
I. La moda es $10.000
II. La mediana es $10.000
III. La media es $9.600
¿Cuántas personas rindieron la prueba?
A) Solo I
A) 5 B) Solo II
B) 6 C) Solo III
C) 8 D) Solo I y II
D) 10 E) I, II y III
E) 11
N1 F1
A) 2, 1 y 5
N2 F2
B) 2, 1 y 2
N3 F3
C) 2.5, 1 y 2
N4 F4
D) 2.5, 1 y 4
E) 2.5, 5 y 4
La media es
N1 + N2 + N3 + N4
A)
4
NF + N F + N3F3 + N4F4
B) 1 1 2 2
4
NF + N F + N3F3 + N4F4
C) 1 1 2 2
F1 + F2 + F3 + F4
N1 + N2 + N3 + N4
D)
F1 + F2 + F3 + F4
E)Ningunade las anteriores 18. Con los siguientes datos:
{A,A,A,B,B,B,C,C,D,D,D,E,E} es posible afirmar que
A) No existe moda
B) Existen dos modas
C) Existen tres modas
D) Todos los datos son moda
E) El promedio es 1
19. Según el gráfico, ¿cuál es la moda de los datos? 21. Si el promedio de edades entre 4 hermanos
es de 7 años. Si a las edades les agregamos la
edad del padre y la madre, entonces el promedio
asciende a 15 años. Entonces el promedio de las
edades de los padres es
6
A) 28
4 B) 31
C) 23
3 D) 35
E) 42
1
2 3 4 5 6 7
A) 3
B) 3,5
C) 4
D) 4,5
E) 5 22. Si se tienen los valores 3, 1, 2, 6, a, 5, 8, 2, 3,
entonces se puede saber el valor de a si
(1) La mediana es 3
(2) La moda es 2
20. Un estudio estadístico emplea datos
consistentes en el peso corporal de un grupo de A) (1) por sí sola
personas. Respecto a estos datos, podemos decir B) (2) por sí sola
que corresponden a una variable C) Ambas juntas, (1) y (2)
D) Cada una por sí sola, (1) ó (2)
I. Cualitativa E) Se requiere información adicional
II. Continua
III. Discreta
A) Solo I
B) Solo II
C) Solo III
D) Solo I y II
E) I, II y III
23. Las edades de un grupo de jóvenes misioneros 25. Si la media entre los datos a y b es 3 y la
es 12, 13, 15, 12 y 14 años. Entonces ¿Cuál(es) de las desviación estándar es 3 , entonces a2 +b2 es
siguientes afirmaciones es(son) verdadera(s)?
igual a
I. La media es 11 años
II. La mediana es 13 años A) 36
III. La desviación estándar es 2 años B) 18
C) 72
A) Solo I D) 48
B) Solo II E) 24
C) Solo III
D) Solo I y II
E) I, II y III
A) Solo I
B) Solo II
C) Solo III
D) Solo II y III
E) Solo I y II
27. La tabla adjunta, muestra la distribución de los 28. El promedio (media aritmética) de las masas de
puntajes de matemática de un grupo de estudiantes 4 personas es 65 kilos. Si la suma de las primeras
del preuniversitario Gauss. De acuerdo con esta 3 personas es 200 kilos, ¿cuál es la masa de la
información, ¿cuál de las siguientes fórmulas última persona?
permite determinar el puntaje promedio de la
muestra? A) 69 kilos
B) 60 kilos
Puntaje Frecuencia C) 6 kilos
D) 62 kilos
Pt1 A1
Pt2 A2
E) No se puede determinar
Pt3 A3
Pt4 A4
Pt5 A5
29. El gráfico de la figura muestra el resultado de 30. La tabla adjunta, muestra los resultados
una encuesta realizada a un grupo de personas obtenidos al lanzar un dado de 8 caras.
sobre su preferencia con respecto a sabores de
helado. Frecuencia
Número
1 2
2 3
14
3 4
12
4 2
10
5 2
8
6 6
6 4
7
4 8 5
2
31. La tabla adjunta, muestra el resultado de 3 32. El gráfico circular de la figura, muestra las
cursos del preuniversitario Gauss en un mismo matrículas del preuniversitario en los meses de
ensayo, ¿Cuál es el promedio (media) entre el total verano, las cuales suman 200 alumnos.
de alumnos de los tres cursos? (los puntajes se
aproximan al entero mayor)
Diciembre
15%
Curso Nº de alumnos Promedio
Marzo
Mañana 4 755 35%
Enero
Tarde 6 804 17%
Noche 5 669
Febrero
33%
A) 740
B) 744
C) 700
D) 745
E) 746 ¿Cuál(es) de las siguientes afirmaciones es(son)
verdadera(s)?
A) Solo I
B) Solo I y II
C) Solo II y III
D) I, II y III
E) Ninguna de las anteriores
33. Dados los puntajes obtenidos por 5 personas 35. La tabla adjunta, muestra la cantidad de
en un ensayo de ciencias: 810, 765, 655, 555 y 605, horas que dura un celular con sistema iOS si lo
¿Cuál(es) de las siguientes afirmaciones es(son) sometemos a un control de calidad. ¿Cuál(es) de las
verdadera(s)? siguientes afirmaciones es(son) verdadera(s)?
I. No existe moda
II. La media es 678
III. La mediana es 605
Intervalo de horas Frecuencia
D) Solo I y III
E) I, II y III
36. En una muestra de 450 elementos, el elemento 38. La desviación estándar entre los elementos 1, 1,
correspondiente al percentil 21 es 1, 1, 1, 2, 2, 2, 3, 4 y 4 es
A) 90
B) 92
12
C) 93 A)
D) 94 11
E) 95 14
B)
11
14
C)
10
17
D)
10
E)Ningunade las anteriores
37. En la muestra
{1, 1, 2, 3, 7, 7, 7, x},
A) 12
B) 15
C) 16
D) 19
E) Nunca coincidirán
MIS ANOTACIONES
Te damos espacio extra para que puedas
desarrollar mejor los ejercicios
CAPÍTULO 2
PROBABILIDADES
DEFINICIONES BÁSICAS
Las probabilidades son la rama de la matemática que estudia el azar, es decir, even-
tos en los cuales uno conoce todos los posibles resultados pero no se conoce con
certeza el resultado de él.
Luego podemos definir el espacio muestral, que es el conjunto formado por todos
los posibles resultados de un experimento aleatorio dado. Por ejemplo, el espacio
muestral de lanzar un dado es {1, 2, 3, 4, 5, 6}.
Llamaremos eventos o sucesos a cada uno de los subconjuntos del espacio muestral.
Por ejemplo, al lanzar un dado el espacio muestral está compuesto por los números
1, 2, 3, 4, 5 y 6. Un evento puede ser obtener un número par (formado por los resul-
tados 2, 4 y 6).
Cuando dos eventos no pueden ocurrir de manera simultánea, los llamamos eventos
mutuamente excluyentes. Por ejemplo, al lanzar un dado consideremos los eventos A
= {1, 3, 5} (obtener un número impar) y B = {2, 4, 6} (obtener un número par). Como
ningún resultado posible es simultáneamente par e impar, decimos que A y B son
mutuamente excluyentes.
7 Probabilidad Clásica
Si en un experimento aleatorio, todos los resultados son equiprobables, es decir,
todos tienen la misma probabilidad de ocurrir, entonces diremos que la probabilidad
que ocurra cierto evento A es
donde E es el espacio muestral. Cabe resal-
#A Número de casos de A
P( A ) =
= tar que de la definición anterior se puede
# E Número de casos totales
observar que la probabilidad de cualquier
evento esta entre los valores 0 y 1, por el
hecho que A ⊂ E.
7 Probabilidad Experimental
Si tomamos por Fr la frecuencia relativa de un evento A, entonces definimos
Cantidad de veces que ocurre A
Fr =
Cantidad de veces que se realiza el experimento
La Ley de los Grandes Números nos dice que si repetimos dicho experimento una can-
tidad suficiente de veces, entonces el valor de Fr será cada vez más parecido a la
probabilidad de ocurrencia del evento A.
3 P(E) = 1
3 P(φ) = 0
3 0 ≤ P(A) ≤ 1
3 Si A ∩ B = φ (son mutuamente excluyentes), P(A ∪ B) = P(A) + P(B)
3 Si Ac = E\A, entonces P(Ac) = 1−P(A)
3 Si A ∩ B ≠ φ, entonces P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
3 Si A y B son eventos independientes, entonces P(A ∩ B) = P(A)· P(B)
7 Probabilidad Condicionada
Diremos que A y B son eventos dependientes si la ocurrencia de uno influye en la
ocurrencia del otro, y en dicho caso tendremos la siguiente regla de probabilidad
P( A ∩ B)
P( A ∩ B) = P( A ) ⋅ P( B| A ) P( B| A ) =
P( A )
donde P(B|A) denota la probabilidad de que ocurra B sabiendo que ocurrió A. Por
lo tanto, como consecuencia inmediata de lo anterior, si A y B son eventos indepen-
dientes, se tendrá que P (B|A) = P (B)
DIAGRAMAS DE ÁRBOL
A veces los problemas se presentan en varias etapas y para visualizarlos mejor, con-
viene pensar en las diferentes etapas como problemas separados. Veamos el siguien-
te ejemplo:
Ejemplo: 1 de cada 10 niños cree en las hadas. 9 de cada 10 niños que cree en las
hadas puede ver a Peter Pan. 1 de cada 10 niños que no cree en las hadas puede ver a
Peter pan. Si Peter Pan visita un niño al azar, ¿Cuál es la probabilidad de que el niño
vea a Peter Pan?
No es fácil dar una respuesta tan sencilla, pues el resultado depende de si el niño
cree o no en las hadas. Pensaremos primero en el caso en que el niño cree: Si el niño
cree, entonces la probabilidad de que vea a Peter Pan es 0.9; mientras que si no cree,
la probabilidad es 0.1. Podemos resumirlo en el siguiente diagrama.
0.1 0.9
Cree No cree
0.9 0.1 0.1 0.9
Ve a No ve a Ve a No ve a
Peter Pan Peter Pan Peter Pan Peter Pan
Para calcular la probabilidad de que el niño vea a Peter Pan, debemos multiplicar las
probabilidades de las ramas que nos llevan a un resultado donde el niño ve a Peter
Pan. Por ejemplo, en este caso, Debemos multiplicar las probabilidades que nos lle-
van al primer caso, es decir 0,9 · 0,1 y las que nos llevan al tercer caso (0,1 · 0,9). Al
sumar ambas tenemos que la probabilidad de ver a Peter Pan es 2· 0,9 · 0,1. Este tipo
de diagramas es conocido como diagrama de árbol y resulta muy útil para resolver
este tipo de problemas.
COMBINATORIA
Ya hemos visto que en un experimento aleatorio donde todos los sucesos elemen-
tales son equiprobables, la probabilidad de un evento A cualquiera puede calcularse
según la regla de Laplace:
P( A ) = # A
#Ω
Solución: El espacio muestral tiene 9 elementos (uno por cada manzana del canas-
to), luego #Ω = 9. Si se define A como el evento donde se extrae una manzana roja,
entonces #A = 5, pues 5 de las manzanas del cesto son rojas. Así, de acuerdo a la regla
#A 5 #A 5
de Laplace, P( A ) = = . De donde la probabilidadPbuscada
( A ) = es= .
#Ω 9 #Ω 9
A pesar de que el procedimiento detrás de este tipo de problemas es bastante sen-
cillo, hay veces en que encontrar el número de elementos presentes en el espacio
muestral o la cantidad de elementos del evento A puede ser muy complicado. Para
ayudarnos a resolver estas dificultades, estudiaremos algunos elementos básicos de
combinatoria, la rama de las matemáticas que se ocupa del estudio del número de
elementos que tienen los conjuntos finitos.
Ejemplo /
Carlos debe escoger entre adoptar un gato o un perro. Si
le han ofrecido 4 gatos y 7 perros ¿Cuántas opciones tiene
Carlos para adoptar un animal?
Ejemplo /
Carlos desea adoptar un gato y un perro. Si le han ofrecido
4 gatos y 7 perros ¿Cuántas opciones tiene para escoger
los animales que adoptará?
El siguiente ejemplo tiene por finalidad ilustrar cómo se aplican estos conceptos a
problemas de probabilidad.
Ejemplo /
Carlos desea adoptar dos animales. Le han ofrecido 4 ga-
tos y 7 perros. Si escoge dos animales al azar entre sus
opciones y los adopta ¿Cuál es la probabilidad de que
adopte dos animales de diferente especie?
56 28
De acuerdo a la regla de Laplace, se tiene P (A) = =
110 55'
PERMUTACIONES
A menudo interesa calcular probabilidades que tienen relación con la cantidad de
maneras de ordenar un conjunto de objetos determinado. Las diferentes ordena-
ciones que puede tener un conjunto son llamadas permutaciones. Para motivar el
estudio de las permutaciones, consideremos el siguiente problema:
Ejemplo /
Fabián tiene una colección de 4 libros ordenados en su re-
pisa según su fecha de lanzamiento. En un descuido, los
libros se caen y Fabián los vuelve a poner en la repisa, pero
sin percatarse del orden. ¿Cuál es la probabilidad de que
el primer y el segundo libro queden en su lugar?
Si en el problema anterior hubiese más libros, por ejemplo, 83, el número de ele-
mentos en el espacio muestral se habría obtenido a partir de una multiplicación
muy tediosa. Si el número de libros es suficientemente grande, ni siquiera cabría en
la hoja. Esto genera la necesidad de definir nueva notación para contar la cantidad
de permutaciones en un conjunto. A continuación se muestra una función cuyo do-
minio son los números cardinales y nos ayuda a simplificar este tipo de problemas.
0! = 1
(n + 1)! = (n + 1)n!
Ejemplo /
Calcule los factoriales de todos los enteros comprendidos
entre 0 y 5.
R: Por definición 0! = 1.
De acuerdo a la segunda parte de la definición:
1! = (0+1)! = 1 · 0! = 1 · 1 = 1.
Análogamente: 2! = (1 + 1)! = (1 + 1) · 1! = 2 · 1 = 2.
Ejemplo /
Escriba como multiplicación el factorial de 10
R: De acuerdo a la observación,
10! = 10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2 · 1
Ejemplo /
Bernardo pertenece a un curso de 40 alumnos. El profe-
sor hace una interrogación sorpresa y llama, uno a uno,
a los 40 estudiantes para hacerles preguntas. ¿Cuál es la
probabilidad de que Bernardo sea el último integrante del
curso en ser interrogado?
39! 39! 1
P (A) = = =
40! 40 · 39! 40
PERMUTACIONES CON
ELEMENTOS INDISTINGUIBLES
Hay veces en que en un conjunto se tienen dos elementos que para propósitos prác-
ticos son indistinguibles. Considere el siguiente ejemplo:
Ejemplo /
¿Cuántas palabras, con o sin sentido, pronunciables o no
pronunciables, pueden formarse con las letras de la pala-
bra MANADA?
n!
n1 ! n2 ! ··· nk !
Ejemplo /
En una orquesta de 20 músicos se necesita un cantante
de primera voz, 3 cantantes de segunda voz, 5 flautistas, 4
tecladistas, 2 violinistas y 5 percusionistas. ¿Cuántas op-
ciones tienen para asignar sus roles?
20!
3!5!4!5!2!1!
Ejemplo /
Un collar circular está formado por una cadena que con-
tiene 5 piedras: Rubí, zafiro, jade, lapislázuli y amatista.
¿Cuántos diseños pueden existir para estos collares?
CANTIDAD DE MUESTRAS
EN UNA POBLACIÓN FINITA
Con las herramientas que manejamos en este momento ya podemos determinar la Observaciones
n
cantidad de elementos de muchos espacios muestrales. En estadística discreta, a El símbolo se llama combinación
k
menudo interesa conocer la cantidad de muestras de un tamaño dado que se pueden y se lee “n sobre k". Se define como
extraer desde una población finita. Para ello clasificamos los procesos de muestreo n n!
=
k k !(n − k )!
de acuerdo a dos criterios. El primer criterio distingue si los elementos pueden ex-
traerse más de una vez (muestreo con reposición) o una vez escogidos no pueden
volver a formar parte de la muestra(muestreo sin reposición). El segundo criterio in- El símbolo Vkn es llamado variación o
dica si una muestra formada por los mismos elementos en diferente orden se consi- arreglo y se lee “variación de n sobre
dera una muestra distinta (con orden) o si se considera como la misma muestra (sin k". Se define mediante la fórmula
orden). La siguiente tabla resume de cuántas formas se puede escoger una muestra n!
Vk n =
de acuerdo a los dos criterios mencionados anteriormente. Si la población tiene n (n − k )!
elementos y se extrae una muestra de tamaño k, entonces la cantidad de muestras
posibles está dado por La combinación a veces se anota Ckn y
la variación a veces se anota Akn.
Con reposición Sin reposición
Con orden nk
V kn
Sin orden
( n + k )
k - 1
( nk )
Este material fue descargado para uso exclusivo de Oscar Rodriguez,
scrcrd17@hotmail.com. Se prohibe su reproducción. Si quieres acceder gratuitamente a
este contenido visita www.psuparatodos.com 43
CAPÍTULO 2 PROBABILIDADES
Ejemplo /
El código genético se determina a partir de combinaciones
de cuatro bases nitrogenadas: Adenina, Citosina, Guanina
y Timina (o Uracilo en el ARN). La unidad de información
básica en el proceso de traducción del ARN mensajero es
llamada codón y está determinada por una secuencia de
tres bases nitrogenadas ¿Cuántos codones distintos pue-
den armarse con cuatro bases nitrogenadas?
Ejemplo /
En el ejército romano, cuando una tropa se acobardaba
durante una batalla o mostraba señales de amotinamien-
to, se aplicaba un castigo conocido como diezmado (deci-
matio). Consistía en que la tropa se dividía en grupos de 10
personas y en cada grupo se escogía al azar un miembro
que debía ser lapidado por los nueve restantes. Si se apli-
ca esta medida en una tropa de 130 miembros, ¿De cuán-
tas formas se pueden escoger los 13 miembros lapidados?
( )
n=130, se tienen 130 maneras de realizar el diezmado.
13
Ejemplo /
Cinco amigos salen de vacaciones en un auto. Si deben es-
coger un piloto y un copiloto, ¿Cuántas opciones tienen?
Ejemplo /
¿De cuántas formas se pueden colocar 5 bolitas idénticas
en 4 urnas enumeradas del 1 al 4?
EJERCICIOS
1. Si se tiene el juego del Loto, donde para cada 3. ¿De cuántas formas puedo ordenar 3 libros en un
cartón de juego se eligen 7 números de 35, estante con 4 espacios?
¿cuál de las siguientes expresiones representa la
cantidad de cartones de juego posibles? A) 6
B) 18
C) 12
A) 35 D) 32
7
E) 24
35
B) 7!
7
35!
C)
7!
35
D)
7
E)Ningunade las anteriores
4. Una mujer tiene 3 clósets donde ordenar sus tres
tipos de ropa: pantalones, blusas y abrigos.
Si cada tipo de ropa va en un único closet, ¿de cuán-
tas maneras distintas se pueden ordenar?
A) 3!
B) 4!
C) 4! · 3
D) 3! · 3!
2. Si se tiene un estante con 7 espacios para libros E) 34
y se desea colocar 4 libros distintos en cualquier
orden. ¿De cuántas maneras se pueden colocar los
libros?
A) 7
4
7
B) 4!
4
7!
C)
4!
7
D)
4
E)Ningunade las anteriores
5. ¿De cuántas maneras pueden sentarse 4 personas 7. Hay que colocar a 5 mujeres y 4 hombres en una
en 10 sillas? fila, de modo que los hombres usen las posiciones
pares, ¿De cuántas maneras puedo hacer la fila?
A) 4!
B) 10! A) 4!
C) 104 B) 5!
C) 9!
D) 10 D) 4!5!
4
E) 5.040 E) 9
4
A) 7
A) 4!
B) 8
B) 49
C) 9
C) 94
D) 10
E) 6 D) 9 4!
4
A) 4! 1
A)
B) 49 2
C) 94 1
B)
13
D) 9 4! 1
4 C)
52
9 1
E) D)
26
4
E)Ningunade las anteriores
13. Se extraen aleatoriamente, sin reposición, cuatro 15. ¿Cuál es la probabilidad de que al lanzar dos
cartas de una baraja inglesa de 52 cartas. ¿Cuál es dados uno de ellos sea 3 si la suma de los dos es 7?
la probabilidad de que haya al menos una jota?
1
A)
4
5
1 1
A) B)
4 3
1
1 C)
B) 2
2 2
48 ⋅ 47 ⋅ 46 ⋅ 45 D)
C)1− 5
52 ⋅ 51⋅ 50 ⋅ 49 1
E)
D) No se puede calcular 6
E) Ninguna de las anteriores
9
A)
20
3
B)
20
9 16. Si se ha lanzado una moneda honesta 765 veces,
y en todos los lanzamientos se obtuvo un sello.
3
C) ¿Cuál es la probabilidad que el lanzamiento 766 sea
20
una cara?
3
12 1
A)
2
3
D) 1
20 B)
765
3 1
20 C)
766
3 2
E) D)
9 766
2
3 E)
3
17. ¿Cuál es la probabilidad que al lanzar 3 dados no 19. Si se extraen dos cartas al azar de un mazo
cargados, se obtengan exactamente tres veces 5? inglés ¿Cuál es la probabilidad aproximada de que
ambas sean de diamante?
1
A)
72 A) 0,05882
1
B) B) 0,0625
55 1
1 C)
C) 2
6 1
1 D)
D) 4
216
1 E) 0,0485
E)
18
18. En una sala de 60 alumnos, se sabe que la 20. En Chile, una patente está formada por dos
probabilidad de escoger uno al azar y que este consonantes (distintas de ñ) seguidas de cuatro
3 dígitos entre 0 y 9. ¿Cuántas patentes distintas
sea hombre es de 5
. De acuerdo a lo anterior,
pueden formarse?
¿Cuántas mujeres hay en el curso?
A) 106
A) 24
B) 272 · 104
B) 20
2 C) 21 · 20 · 10 ·9 · 8 · 7
C)
5 D) 21 + 21 + 10 + 10 + 10 + 10
E) 212 · 104
D) 36
E) Ninguna de las anteriores
21. Cuando llueve, la probabilidad de que una 23. De un mazo inglés de cartas (52 cartas), se
1
jugadora de fútbol anote un gol es . Si la sacan 2 cartas al azar, entonces ¿Cuál es la
2 4
probabilidad de que no llueva es , ¿cuál es la probabilidad de que de esas cartas una sea de
3
probabilidad de que llueva y la jugadora haga un gol? diamante y la otra de trébol?
12
1 A)
A) 1.326
6 26
B)
1 1.326
B)
12 C)
13
10 204
C) 156
14 D)
1 1.326
D) 56
4 E)
1.326
E)Otro valor
A) 1
1
B)
8
1
C)
16
1
D)
32
E) 0
24. Si tenemos 4 conjuntos de números A, B, C y D 26. En una sala de clases hay 3 hombres y 9
dados por mujeres. Se sabe que 2 de esos hombres y 5 de
A = {1, 2, 3, 4}, esas mujeres prefieren clases interactivas y el
B = {1, 2, 3, 4, 5, 6, 7, 8, 9}, resto prefiere clases tradicionales. Si se elige una
C = {5, 6, 7, 8, 9}, persona al azar, ¿Cuál es la probabilidad de que
D = {1, 2, 3, 4, 5, 6}. esa persona sea hombre y prefiera las clases
interactivas?
Si formamos al azar un número de cuatro dígitos de
la forma digAdigBdigCdigD, donde digA es un número 1
A)
del conjunto A y así sucesivamente, entonces 6
¿Cuál es la probabilidad de que este sea divisible 2
B)
por 2? 3
2
C)
103 5
A)
1.305 1
D)
26 12
B)
25.430 3
E)
130 5
C)
1.020
156
D)
25.430
12.715
E)
25.430
28. Si se lanza un dado de 8 caras, ¿Cuál es la 30. Si se lanzan 4 monedas no cargadas, ¿Cuál es la
probabilidad de obtener un número impar o un probabilidad de obtener dos caras y dos sellos?
número mayor o igual que 5?
3
A)
1 5
A)
6 5
1 B)
B) 8
3 3
3 C)
C) 8
4
D)1
6
D)
E)0 11
E)Ningunade las anteriores
29. Si se lanzan 3 monedas, ¿Cuál es la probabilidad 31. Si una gata tiene 4 gatitos, ¿Cuál es la
de obtener dos caras y un sello? probabilidad de que sean un macho y tres hembras?
4 4
A) A)
5 9
3 1
B) B)
8 4
4
3 C)
C) 5
5
1
6 D)
D) 2
15 1
E)Ningunade las anteriores E)
3
32. En una caja hay 30 aros de perla de igual peso 34. Un hotel para mascotas tiene 25 perros entre
y tamaño, de las cuales 8 son celestes, 10 son café y negros, y se sabe que 15 de ellos son café. Si
blancos y el resto son rosados. Si se extraen 6 aros se abre la puerta del lugar y se escapa un perro,
al azar, ¿Cuál es la probabilidad de extraer un aro ¿Cuál es la probabilidad de que sea negro?
celeste, uno blanco y uno rosado, en ese orden y sin
reposición? 10
A)
23
5
B)
8 10 12 16
A) ⋅ ⋅ 2
30 30 30 C)
8 10 12 5
B) ⋅ ⋅ 3
30 28 26 D)
7
8 10 12
C) + + 4
30 28 26 E)
11
8 10 12
D) ⋅ ⋅
30 29 28
8 10 12
E) + +
30 29 28
5
A)
11
4
B)
11
6
C)
11
2
D)
11
E)Ningunade las anteriores
35. La tabla adjunta muestra el número de 36. La probabilidad de que al lanzar 2 dados, la
empresas que poseen un determinado número de suma de los números sea mayor o igual que 5 es
software para administrar sus negocios. Al
seleccionar una de estas empresas al azar. 1
A)
6
5
Nº de empresas Nº de software B)
6
4 0 3
C)
2 1 4
1 2 5
D)
4 3 9
6
5 4 E)
5 10
6
7 6
11
A)
29
11
B)
27
15 37. Si se tiene una moneda cargada, donde la
C) 1
27 probabilidad de obtener cara es y se sabe
3
11
D) que esta siempre sale cara o sello, entonces
30
13 la probabilidad de sacar tres sellos en tres
E)
27 lanzamientos es
8
A)
27
11
B)
27
15
C)
27
14
D)
27
13
E)
27
38. En la pregunta anterior, la probabilidad de sacar 40. Según el problema anterior, la probabilidad de
al menos dos caras en tres lanzamientos es lanzar dos veces el dado y obtenerun 1 y un 6, en
ese orden es
8
A)
27 2
A)
5 49
B)
27 1
7 B)
C) 49
27 2
11 C)
D) 25
27
1
3 D)
E) 25
27
E)Ningunade las anteriores
1
A)
7
2
B)
7
1
C)
5
2
D)
5
E)Ningunade las anteriores
INTRODUCCIÓN
La rama de la estadística que veremos a continuación estudia cómo inferir o deducir
características de una población a partir de una pequeña parte de ella, debido a que
en muchos estudios es imposible tomar la totalidad de la población, esta forma de es-
tudiar colecciones de datos es llamada Inferencia Estadística, y responde a las pre-
guntas: ¿Cómo podemos sacar conclusiones acerca de las características de la pobla-
ción si no conocemos todos sus elementos? ¿Qué tan fiables son estas estimaciones?
Para realizar inferencias estadísticas estudiamos una parte pequeña, pero represen-
tativa de la población que llamamos una Muestra, y extrapolamos (inferimos) con-
clusiones sobre la población general a partir de ella.
TÉCNICAS DE MUESTREO
Llamamos muestreo a las técnicas que utilizamos para escoger una muestra a partir
de una población.
Los tipos de muestreo se clasifican en muestreos probabilísticos y no probabi-
lísticos. En un muestreo probabilístico, cada elemento de la población tiene una
determinada probabilidad de pertenecer a la muestra, y dicha probabilidad se puede
calcular sin ambigüedad. En los muestreos no probabilísticos en cambio, se descono-
ce la probabilidad de que un individuo determinado pertenezca a la muestra.
Siempre existe algún error pues la muestra no es completamente fiable, sólo una
buena aproximación, y a este error se le llama error de muestreo.
7 Muestreo aleatorio
Si todas las muestras posibles de una población pueden ser tomadas con la misma
probabilidad, este muestreo es un Muestreo Aleatorio. Distinguimos dos tipos:
DISTRIBUCIÓN NORMAL
La distribución más importante que se estudia es la llamada distribución normal
o distribución Gaussiana, y es posible aplicar esta distribución a cualquier grupo
de datos cuya distribución se asemeja al siguiente gráfico:
( x − µ )2
1 −
f (x) = e 2σ 2
σ 2π
100
80
Frecuencia
60
40
20
0
6 8 10 12 14 16 18
Cuando una variable X sigue una distribución normal de media μ y varianza σ2, es-
cribimos X ∼ N (μ, σ2).
Estas preguntas tienen una solución que es a la vez simple y complicada. La simple
es: El porcentaje de datos que responde estas preguntas es el área bajo la curva de la
distribución normal que se encuentra entre los parámetros pedidos.
Pero calcular esta área es extremadamente difícil, por lo que utilizamos unos in-
tervalos notables con porcentajes ya conocidos para cualquier distribución normal.
μ (valor estimado)
Probabilidad
34% 34%
14%
2% 2%
μ - 2σ μ - σ μ μ+σ μ + 2σ Variable
Si se necesita calcular otros percentiles, hay malas noticias: hasta el día de hoy no
se ha descubierto un método para calcularla de manera exacta. Sin embargo, exis-
ten tablas con muy buenas aproximaciones. Ahora, no es posible escribir una tabla
para cada una de las combinaciones posibles de media y desviación estándar, enton-
ces convenimos en utilizar la distribución normal estándar o normal tipificada
como referencia, a la cual llevaremos cualquier otra distribución.
Definición: Si una variable Z sigue una distribución N(0,1), se dice que Z tiene una
distribución normal estándar o normal tipificada.
Para llevar una distribución cualquiera a esta distribución N(0,1), utilizamos una
técnica llamada estandarización o tipificación, que nos permite relacionar una
distribución normal de media y desviación estándar arbitrarias con una distribución
N(0,1).
X−µ
Propiedad: Si X ∼ N (μ, σ2), entonces Z = tiene una distribución normal es-
tándar.
σ
z P(Z < z)
0,67 0,749
0,99 0,839
1,00 0,841
1,15 0,875
1,28 0,900
1,64 0,950
1,96 0,975 0 z Z
2,00 0,977
2,17 0,985
2,32 0,990
2,58 0,995
INTERVALOS DE CONFIANZA
Puede ocurrir que al tomar dos muestras representativas diferentes dentro de una
misma población, se obtengan estadísticos diferentes. Esto no necesariamente sig-
nifica que el estudio esté mal realizado, sino que simplemente es un reflejo de que
hay azar involucrado en el proceso de muestreo.
Para estimar el error que induce el azar, se establece un rango de valores que po-
drían contener el valor del parámetro poblacional estimado, con cierta probabilidad.
A esta probabilidad se le conoce como nivel de confianza y su principal objetivo es
evaluar la validez del muestreo.
Donde z a corresponde al valor tal que el a % de los datos es mayor en una distribu-
(2) 2
ción normal estándar.
σ
La cantidad z a es llamada error de muestreo o error y suele ser expresado
2 n
como porcentaje.
Ejemplo: En un laboratorio, se cuenta con una muestra de 121 frascos con jarabe,
se sabe que la cantidad de sacarosa presente en ellos sigue una distribución nor-
mal de desviación estándar 10g. Si la media de la cantidad de sacarosa en estos 121
frascos de jarabe es 640g, el intervalo del 95% de confianza, en gramos, está dado
aproximadamente por [638,22; 641,78], con un error de 1.782 ya que al reemplazar
los valores correspondientes x = 640; σ = 10; n = 121 y z(a)= z0,025 = 1.96 se obtienen
2
dichos valores.
Ejemplo /
Las estaturas de un grupo de personas siguen una distribución
normal de media 1,40m y desviación estándar 20 cm.
Solución (a)
Como el 68,3% de los individuos se ubica a menos de una des-
viación estándar de la media, podemos asegurar que el 68,3%
de los estudiantes tiene una estatura x tal que |x - μ| ≤ σ, es
decir, -σ ≤ x - μ ≤ σ. Al sumar μ en cada miembro de la desigual-
dad, resulta μ - σ ≤ x ≤ μ + σ. Considerando que μ = 1,4 y σ = 0,2
(al medir en metros) se obtiene 1,4 - 0,2 ≤ x ≤ 1,4 + 0,2. Así, se
sigue x ∈ [1.2,1.6]. Por lo tanto, el 68,3% de los integrantes mide
entre 1,2m y 1,6m.
Solución (b)
Considerando que el 95,5% de los individuos tiene una estatura
que se encuentra en el intervalo [μ - 2σ,μ + 2σ], se tiene que el
95,5% de las estaturas de los individuos se ubica en el intervalo
[1,0;1,8]. Si de ese intervalo restamos el 68,3% de las personas
cuyas estaturas estaban entre 1,2 y 1,6 (se calculó en (a)). En-
Ejemplo /
En cierta ciudad, la temperatura diaria sigue una distribución
normal de media 18° y desviación estándar 2°. ¿Qué porcentaje
de los días habrá una temperatura mayor a 20°?
Solución
Si llamamos T a la temperatura en un día, se tendrá que
T ∼ N(18,4). Al estandarizar, se obtiene que (T - 18) / 2 ∼ N(0,1).
El siguiente paso consiste en relacionar la desigualdad T >
20 con una desigualdad que involucre la variable estandari-
zada. Al restar 18 y dividir por 2 en esta desigualdad resulta
T − 18 20 − 18 T − 18 20 − 18
> , es decir, > 1. De acuerdo al valor tabulado,
2 2 2 2 T − 18 20 − 18
el 84,1% de los días satisfacen que > 1. Por lo tanto, el
≤
2 2
15,9% restante satisface la condición buscada.
EJERCICIOS
5. Si una población sigue una distribución normal 7. Si Z ∼ N(0,1) ¿Cuál de las siguientes expresiones
estándar ¿Cuál de estos valores corresponde al tiene un valor igual a P(Z < -2)?
percentil 95 de la población?
A) P(Z > -2)
A) 0,67 B) P(Z ≤ 2)
B) 1 C) P(Z > 2)
C) 1,28 D) P(-1 < Z < 1)
D) 1,64 E) Ninguna de las anteriores
E) 1,96
6. Una población sigue una distribución N(4,25) 8. Una población sigue una distribución N(3,5) ¿Qué
¿Cuál de las siguientes afirmaciones es falsa? distribución tendrá si cada dato se multiplica por 2?
9. ¿Cuál de las siguientes cantidades no sigue una 11. La cantidad de teléfonos celulares por familia
distribución normal? en una ciudad se modela por medio de una
distribución normal con media μ y varianza 0,25. Se
A) Los puntajes de la PSU de historia obtenidos por toma una muestra aleatoria de 100 familias de esta
los postulantes que rindieron la prueba el año 2014 ciudad, obteniéndose una media de 3,5 celulares.
B) Las estaturas de niños de un curso Para los resultados de esta muestra, ¿Cuál de los
C) El tiempo de vida útil de las ampolletas de una siguientes intervalos es el intervalo de confianza de
marca dada nivel 0,90 para μ?
D) La temperatura media que se registra en un
mismo mes 1 1
A) [3,5-1,64 · ;3,5+1,64 · ]
E) Ninguna de las anteriores 40 40
1 1
B) [3,5-0,9 · ;3,5+0,9 · ]
200 200
1 1
C) [-1,64 · ;1,64 · ]
400 400
1 1
D) [-0,90 · ;0,90 · ]
20 20
1 1
E) [3,5 − 1,64 · ;3,5 + 1,64 · ]
10. Se dice que un individuo padece de retraso 20 20
mental si su coeficiente intelectual está entre
70 y 85 puntos. El coeficiente intelectual de los
individuos de un país sigue una distribución normal
de media 100 y desviación estándar 15. ¿Qué 12. Al respecto de la gráfica de una campana de
porcentaje de la población de este país padece de gauss se afirma:
retraso mental?
I. Al incrementar la media poblacional, la
A) 95,5% gráfica se desplaza hacia la izquierda
B) 47,75% II. Es simétrica respecto de la media
C) 68,3% III. La curva se vuelve más plana al
D 34,15% incrementar la varianza
E) 13,6%
Es(son) verdadera(s)
A) Sólo I
B) I y II
C) I y III
D) II y III
E) I, II y III
13. Se desea estimar el tiempo promedio que tarda 15. Si Z ∼ N(0,1), entonces P(1,15 < Z < 1,28) =
un atleta en completar una carrera de 100 metros
planos. Tras observar a 15 atletas se obtiene un A) 0,875
intervalo de confianza de nivel 0,95 dado por [13,20] B) 0,900
medido en segundos. ¿Cuál de estas afirmaciones C) 0,950
es verdadera? D) 0,025
E) 0,125
A) El 95% de los atletas tarda en promedio entre
13 y 20 segundos en completar una carrera de 100
metros planos
B) Hay una probabilidad de 0,975 de que el tiempo
que tardan los atletas en promedio de completar
una carrera de 100 metros planos se encuentre en
el intervalo [13,20]
C) Al observar más atletas, la probabilidad de
que el promedio se encuentre en el intervalo de
confianza incrementa
D) Si el tiempo que tardan los atletas sigue una 16. En un estudio se desea estimar el diámetro
distribución normal, entonces la media muestral medio de las piernas en una población de jirafas.
obtenida fue de 16,5 segundos. Considerando una distribución normal de varianza
E) Ninguna de las anteriores 25 cm2 para el diámetro de las piernas de las
jirafas. Si [⋅] representa la función parte entera,
¿cuál debe ser el tamaño muestral para que la
amplitud del intervalo de confianza al nivel 0.99
construido a partir de la muestra sea menor a 2 cm?
C) -2,17
E) [(5 · 2,58)2 ]+1
D) -2,00
E) -1,96
17. Un instructor de esgrima desea medir el tiempo 19. ¿Cuál de los siguientes histogramas representa
que tardan sus deportistas en reaccionar a la mejor a una distribucón normal?
señal de partida dada por el árbitro al comenzar
los combates. Tras medir los tiempos de retardo
en la reacción de sus 16 alumnos obtiene las
respuestas 5, 7, 3, 13, 4, 5, 3, 6, 8, 11, 10, 9, 9, 6, 5,
9, medidas en centésimas de segundo. Si deseara
tomar una muestra de tamaño 5, ¿Cuál de estas no A) B)
corresponde a un muestreo sin reposición?
A) 5, 3, 4, 5, 11
B) 3, 4, 6, 8, 9
C) 9, 9, 9, 10, 11
C) D)
D) 5, 7, 5, 7, 3
E) A, C y D son correctas
E)
18. El diámetro de los troncos de los sauces sigue 20. Un señor del mal tiene 10 esclavos. Cada
una distribución normal de media 15m y desviación mañana escoge a 3 por muestreo aleatorio
estándar 5m. ¿Cuál es la probabilidad de que el simple con reposición y los castiga. ¿Cuál es la
diámetro del tronco de un sauce mida menos de probabilidad de que el mismo esclavo sea castigado
26.6 m? 3 veces durante una mañana?
A) 0,977 1
A)
B) 0,985 10
C) 0,99
D) 0,995 1
B)
E) 0,01 100
3
C)
10
2
D)
10
1
E)
1000
21. Con los datos de la pregunta anterior ¿Cuál es 23. Un practicante de lucha Greco-romana postula
la probabilidad de que algún esclavo sea castigado a un cupo para un campeonato regional. Los orga-
exactamente dos veces durante la misma mañana? nizadores declaran mediante un comunicado que
solo aceptarán a los postulantes que pertenezcan
27
A) al 1.5% con mejor desempeño en una prueba de
100
fuerza. Si nuestro luchador sabe que los puntajes
9 de dicha prueba siguen una distribución normal
B)
1000 con media 4 y desviación estándar 3, ¿Cuál es el
mínimo puntaje que debe obtener en la prueba para
9 clasificar?
C)
100
27 A) 9,88
D) B) 10,34
1000
C) 10,51
E) Otro valor D) 10,96
E) 11,74
22. Con los datos de la pregunta 20, ¿Cuál es 24. ¿Cuál de los siguientes histogramas representa
la probabilidad de que castigue a tres esclavos una distribución de mayor varianza?
diferentes durante la mañana?
28
A)
100
72
B)
1000
A) B)
72
C)
100
D) 1
E) Otro valor
C) D)
E) No se puede determinar
25. La amplitud de un intervalo de confianza para 27. Considere una población de distribución normal
la media poblacional de una distribución normal de varianza 4. Si se desea construir un intervalo
incrementa si del 95% de confianza a partir de una muestra de
tamaño 100, ¿cuál es el error de esta estimación?
I. La varianza poblacional incrementa
II. La media muestral incrementa 1.96
A)
III. El tamaño muestral incrementa 5
IV. El nivel de confianza del intervalo
3.92
incrementa B)
5
Son verdaderas: 1.96
C)
50
A) Sólo I
B) Sólo IV 1.64
D)
C) I y IV 5
D) II y III
E) Ninguna de las anteriores
E) I, III y IV
29. La efectividad de una vacuna en un paciente 31. Sean X e Y dos variables aleatorias
enfermo se rige por una distribución normal. independientes tales que X ∼ N(0,1) e Y ∼ N(2,3).
Si se estudia la efectividad en una muestra de ¿Cuál es el valor de P(X + Y > 6)?
121 pacientes, obteniendo un error del 10% al
construir un intervalo de 99% de confianza ¿Cuál A) 0,045
es la desviación estándar de la efectividad de las B) 0,159
vacunas? C) 0,977
D) 0,023
1,21
A) E) Otro valor
6,6564
0,1
B)
28,38
11
C)
25,8
1,1
D)
2,32
11
E)
2,58
33. Si X ∼ N(a + b,a + 2b) e Y ∼ N(a + 2b,a − b) son 35. Si X ∼ N (μ, 1) ¿Qué valor debe tener μ para que
variables aleatorias independientes ¿Qué valor P(X ≤ 8) = 0,841
debe tomar a para que la variable aleatoria X + Y
siga una distribución normal estándar? A) 7
1 B) 6
A)
2 C) 8
D) 0
1 E) Ninguno de los valores anteriores
B)
4
1
C) -
2
3
D)
4
E) No existe tal valor de a
34. Suponga que X ∼ N (5,92) e Y ∼ N (−3,34). Al 36. Si X e Y son variables aleatorias independientes
respecto se afirma de distribución normal estándar ¿Cuál es la
probabilidad aproximada de que el interior del
I. La población X es más homogénea que la cuadrado de centro en el origen, lados paralelos a
población Y los ejes y lado 2 contenga al punto (X,Y)?
II. Al extraer muestras aleatorias de 10
individuos de cada población, La media A) 0,68
muestral de X tiene una varianza menor a B) 0,95
la media muestral de Y C) 0,46
III. La campana de Gauss asociada a la D) 0,90
variable X tiene a la recta x = 5 como eje de E) Otro valor
simetría
Es(son) falsa(s):
A) Sólo I
B) Sólo II
C) I y II
D) II y III
E) I, II y III
37. Se puede conocer la media poblacional a partir 39. Se puede determinar P(X > μ + 2) si
de una muestra si
(1) X ∼ N(μ + 2,1)
(1) Se conoce la media muestral (2) μ + 2 es la mediana de la población
(2) Se conoce la varianza poblacional
A) (1) por sí sola
A) (1) por sí sola B) (2) por sí sola
B) (2) por sí sola C) Ambas juntas, (1) y (2)
C) Ambas juntas, (1) y (2) D) Cada una por sí sola
D) Cada una por sí sola E) Se requiere información adicional
E) Se requiere información adicional
38. Se puede conocer la probabilidad de que un 40. Se puede conocer la mediana de una población
individuo de una población pertenezca a una normal si:
muestra si
(1) Se conoce la media
(1) Se conoce el tamaño muestral (2) Se conoce la varianza
(2) La técnica de muestreo es muestreo
aleatorio simple A) (1) por sí sola
B) (2) por sí sola
A) (1) por sí sola C) Ambas juntas, (1) y (2)
B) (2) por sí sola D) Cada una por sí sola
C) Ambas juntas, (1) y (2) E) Se requiere información adicional
D) Cada una por sí sola
E) Se requiere información adicional
VARIABLES ALEATORIAS
Una Variable aleatoria es una medida que utilizamos para cuantificar los resul-
tados posibles de un experimento aleatorio, está definida como una función X que
relacióna cada elemento del espacio muestral con un número real. Es decir:
X : Ω → R
3 ∑ f ( i ) = 1
i ∈ Rec(X)
También podemos definir la función de distribución F(X), que nos indica la pro-
babilidad de que la variable tome un valor igual o menor, es decir:
ESPERANZA Y VARIANZA
DE UNA VARIABLE ALEATORIA
La Esperanza o Valor Esperado de una variable aleatoria es simplemente el valor
promedio que uno obtendría al realizar infinitos experimentos, por lo tanto mien-
tras más experimentos se realicen, más tiende a acercarse el promedio hacia la Espe-
ranza. Esta se define como:
E( X ) = ∑
xi ∈ Rec(X)
f ( xi ) · xi
La Varianza es ligeramente distinta del concepto que usamos al trabajar con datos,
como estos están fijos su varianza sólo mide la dispersión de los datos, en el caso de
una variable aleatoria la varianza mide su variación ideal, y se calcula muy fácilmen-
te usando la esperanza:
StDev( X ) = Var( x )
DISTRIBUCIONES IMPORTANTES
DE VARIABLES ALEATORIAS
7 Distribución de Bernoulli
La distribución de Bernoulli es la forma en la que se distribuyen los resultados de
una variable que sólo tiene dos resultados posibles, a estos dos resultados los lla-
mamos un éxito o un fracaso, por ejemplo lanzar una moneda sigue una distribución
de bernoulli.
La ventaja es que esta moneda no debe ser justa, es decir las probabilidades de éxito
o fracaso no necesitan ser mitad y mitad, formalmente:
7 Distribución Binomial
La distribución binomial es un caso similar al de la distribución de Bernoulli en el
que también buscamos éxitos y fracasos, pero en lugar de medir esta probabilidad
medimos la probabilidad de obtener cierta cantidad de éxitos en alguna cantidad de
experimentos:
n
P( X = k ) = p k (1 − p)n− k
k
Luego, ajustaremos nuestras definiciones para reutilizar los conceptos que vimos en
variables aleatorias discretas en continuas.
Es importante notar que el ejemplo más claro y estudiado de una variable de este
tipo es la Distribución normal en la cual los intervalos que nos dan la probabilidad
son aquellas áreas bajo la curva de la distribución. Así, si vemos la normal como una
Variable aleatoria continua, tenemos que el área total bajo la curva es 1, y por lo
tanto es exactamente lo mismo preguntar qué porcentaje de esta área se encuentra
en un intervalo, a preguntar cual es la probabilidad de caer en ese intervalo si elijo
un valor al azar
EJERCICIOS
1. ¿Cuál de las siguientes es una variable aleatoria? 3. Se lanzan dos monedas y se define X = 1 si las
monedas tienen el mismo resultado y X = 0 si no
A) El número de caras de un dado lo tienen. ¿Cuál es el dominio de esta variable
B) El punto de ebullición del agua, medido en aleatoria?
grados Kelvin
C) El resultado obtenido al lanzar un dado común A) {(cara, cara), (cara, sello),
D) El número de habitantes que había en Texas el (sello, cara), (sello, sello)}
día 1 de Enero de 1999 B) {cara, sello}
E) Ninguna de las anteriores C) {0, 1}
D) {0,1,cara, sello}
E) No se puede determinar
2. ¿Cuál de las siguientes no se clasifica como una 4. Se define la variable aleatoria X como la suma
variable aleatoria discreta? de los resultados obtenidos al lanzar dos dados
comunes. ¿Cuál es el recorrido de X?
A) Se encuesta a 100 personas al azar y se define
la variable aleatoria X como el número de mujeres A) {2,3,4,5,6,7,8,9,10,11,12}
encuestadas. B) {(1,1),(1,2),(1,3),(1,4)(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),
B) Se lanzan 4 dados comunes y se define X como (2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),
la suma de las puntuaciones obtenidas. (4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),
C) Se recorren 20 calles de Santiago en Auto y se (6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}
define X como el número de semáforos que se C) {1,2,3,4,5,6}
encuentran en luz roja al pasar por ellos. D) {1,2,3,4,5,6,7,8,9,10,11,12}
D) Se observa la carrera de un nadador y se E) Ninguna de las anteriores
define X como el tiempo que tarda en completar el
recorrido.
E) Ninguna de las anteriores.
5. Una urna contiene 10 bolitas blancas y 4 bolitas 7. Se pagan $400, se lanza un dado común y se
negras. Se extraen al azar, sin reposición, 5 bolitas reciben $100 multiplicado por el valor que muestra
de la urna y se define la variable aleatoria X como el el dado. ¿Cuál es el balance esperado?
número de bolitas blancas extraídas. ¿Cuál(es) de
las siguientes afirmaciones es(son) verdadera(s)? A) -200
B) -50
I. P(X = 0) = 0 C) 0
D) 350
10
II. P (X = 1) = E) 50
14
10 4
3 2
III. P (X = 3) =
14
5
A) Sólo I
B) Sólo III
C) I y III
D) II y III
E) I, II y III
9. El tiempo de espera de las personas, en minutos, 11. Se lanza un dado 20 veces y se definen las
en cierto paradero de Transantiago, tiene una variables aleatorias X e Y, donde X es el número
función de distribución dada por F(x) = 1 - e-2x ¿Cuál de veces que se obtiene un número par e Y es el
es la probabilidad de esperar 2 minutos o menos? número de veces que se obtiene un número impar.
¿Cuál(es) de las siguientes afirmaciones es(son)
A) e-4 verdadera(s)?
B) e-2
C) 1 - e-2 I. P(X = 4) = P(Y = 16)
D) 1 - e-4 II. P(X = 5) = P(Y = 5)
E) Otro valor III. P(X = 9) = P(X = 11)
A) Sólo I
B) I y II
C) I y III
D) II y III
E) I, II y III
10. En el bosque de caperucita roja se ha instalado 12. ¿Cuántas monedas se deben lanzar para que la
un hogar de ancianos. Se sabe que una de cada varianza del número de caras sea 1?
10 ancianas que vive en ese hogar es un lobo
disfrazado. Si el 60% de la gente que se queda en A) 1
el hogar son ancianas y se escogen 15 personas B) 2
mediante muestreo aleatorio simple, al definir C) 3
la variable aleatoria X como el número de lobos D) 4
escogidos, resulta P(X = 2) = E) No se puede obtener varianza 1
15
A) 0,62 0,413
2
10 2 13
B) 0,1 0,9
2
15
C) 0,062 0,9413
13
10
D) 0,062 0,9413
2
E) Otro valor
13. ¿Cuál es el recorrido de una variable aleatoria 15. Defina la variable aleatoria X como el número
normal de media 3 y varianza 16? obtenido al lanzar un dado común. Suponga
que se lanza medio millón de dados comunes
A) - {3} y se registran los resultados en una tabla de
B) Q frecuencias. De acuerdo a la ley de los grandes
C) [-1,7] números, ¿Cuál de estos valores es una mejor
D) ]-1,7[ estimación para la frecuencia relativa acumulada
E) del número de dados que muestran el número 3 en
su cara superior?
k 1 2 3 4
P(X = k) p 2p 3p 4p
¿Cuál es el valor de la función de distribución de X 16. Considere una variable aleatoria discreta X
evaluada en 3? cuya desviación estándar es 8 y su recorrido es un
subconjunto del intervalo ]-∞,0]. Considere además
A) 0,1 que E[X2] = 100. ¿Cuál es el valor esperado de X?
B) 0,3
C) 0,4 A) 6
D) 0,6 B) 36
E) No se puede determinar C) 64
D) -6
E) No se puede determinar
17. Se lanzan dos dados comunes de manera 19. El número de patos que hay en una laguna al
simultánea y se define la variable aleatoria X como mediodía se rige por una función de probabilidad
el mayor valor obtenido. ¿Cuál es la función de dada por
x
probabilidad de la variable aleatoria X? 1 , si x ∈N
f (x ) = 2
x
A) f(x)= 0, en otros casos
6
1 Si se observa la laguna al medio día durante 10000
B) f(x)=
6 días, de acuerdo a la ley de los grandes números,
2x − 1 ¿Cuántas veces se encontrarán exactamente 2
C) f(x)=
36 patos?
x
D) f(x)=
36 A) Aproximadamente 1/4
E) Ninguna de las anteriores B) Aproximadamente 2500 días
C) Exactamente 2500 días
D) Aproximadamente 5000 días
E) Exactamente 1000 días
3 5 Se afirma:
5 1 9
A) I. La función de distribución de X,
3 10 10
evaluada en 2, corresponde a 0,3
3 5
8 1 9 II. La función de probabilidad de X
B)
3 10 10 evaluada en 1 corresponde a 0,2
3 III. El valor esperado de la variable
8 1
C) aleatoria es 1,5
3 10 No son verdaderas:
8
8 1
D)
3 10 A) Sólo I
8 B) Sólo II
1
E) C) Sólo III
10 D) I y III
E) II y III
21. En un control de calidad, se dejan caer 1000 23. En un curso de 38 estudiantes, de los cuales
botellas de vidrio y se define la variable aleatoria 19 son mujeres y 19 son varones, se escoge un
X como el número de botellas que se quiebran. Si integrante al azar. Se define la variable aleatoria
la probabilidad de que una botella se quiebre es X ∼ Bernoulli (p), que toma el valor 1 cuando
9/10, entonces al aproximar esta variable aleatoria se escoge una mujer y 0 cuando se escoge un
mediante una distribución normal X∼ (μ,σ2), el valor varón. ¿Cuál es el parámetro p para esta variable
de σ es: aleatoria?
A) 30 A)19
B) 1000 B) 1
C) 3 10 C) 0,4
D) 900 D) 0,5
E) 90 E) Otro valor
22. Una variable aleatoria X tiene por recorrido 24. Una variable aleatoria tiene una distribución
al conjunto {1, 2, 3}. Si F(x) es su función de binomial de parámetros n y p, ¿Cuál de los
distribución y F(2) = 0,9, entonces P(X = 3) = siguientes no puede ser el valor de (n,p)?
A) 0,1 1
A) (9, )
B) 0,9 2
C) 1 4
B) (3, )
D) 0 9
E) Otro valor 1
C) (2, )
5
9
D) (9, )
7
E) Ninguna de las anteriores
25. En un estudio social se entrevistará a 10.000 27. Se ordenan al azar las letras de la palabra
personas y se preguntará si comen queso en el “PREUGAUSS” y se define la variable aleatoria X
desayuno. Se estima que el 60% de las personas como el número de letras que quedan en el lugar
come queso al desayunar. Si se modela el número correcto. Interpretando el concepto de variable
de personas encuestadas que responde que come aleatoria como función ¿Cuál es el valor de
queso durante el desayuno como una variable X (AUEUPRGSS)?
aleatoria de distribución binomial y se aproxima
mediante una distribución normal, la probabilidad A) 1
de que al menos 4.000 personas respondan que no B) 2
comen queso es: C) 3
D) 4
A) 0,5 E) 5
B) 0,749
C) 0,67
D) 0,977
E) Otro valor
26. Si X es una variable aleatoria de distribución 28. Al lanzar un dado común y definir la variable
binomial con parámetros 5 y 0,4 e Y es una variable aleatoria X como el resultado obtenido, la función
aleatoria de distribución binomial independiente de de distribución es:
X con parámetros 3 y 0,4, entonces
1
A) F(x) =
2 6
A) X + Y Bin(8, ) x
5 B) F(x) =
2 6
B) X + Y Bin(4, ) C) F(x) = x
5
4 D) F(x) = 3,5
C) X + Y Bin(8, )
5 E) Otro valor
4
D) X + Y Bin(4, )
5
E) Ninguna de las anteriores
29. Con respecto a una variable aleatoria continua 31. Se puede conocer el valor esperado de una
es siempre cierto que: variable aleatoria discreta X si se sabe:
33. Se tiene una cierta cantidad de fichas rojas y 35. Se tiene una urna con 20 bolitas iguales en cuyo
blancas repartidas en dos urnas. Se extrae una exterior se escribieron números naturales. Si defi-
ficha de cada urna y se define la variable aleatoria X nimos la variable aleatoria X como “la cantidad de
como “la cantidad de fichas rojas extraídas”. Si en números pares que se obtienen al sacar 5 bolitas
cada urna hay fichas de un único color, entonces el sin reposición”. Si P(X ≤ 2)=1 podemos asegurar que
recorrido de la variable aleatoria es: en la urna:
A) Solo I
B) Solo II
C) Solo III
D) I y II
E) I, II y III
37. Se lanza una moneda n veces y se define la 39. De una urna con bolitas rojas, azules y blancas
variable aleatoria S como "la cantidad de sellos que se extraen dos bolitas y se define la variable
aparecen”. Si P(S = 0) = 1 entonces n = aleatoria X como “la cantidad de bolitas blancas
8 extraídas”. Se pueden determinar los posibles
A) 3 valores de X si sabemos que:
B) 8
C) 24 (1) La probabilidad de que las dos bolitas
D) 2 extraídas sean azules es de un 20%.
E) 1 (2) La probabilidad de no obtener ninguna
bolita azul es de un 50%.
A) Solo I
(1) La probabilidad de obtener al menos una
B) Solo III
consonante es 9
C) I y II 25
D) I y III
(2) La probabilidad de obtener dos
E) I, II y III
consonantes es de 2
50
A) (1) por sí sola
B) (2) por sí sola
C) Ambas juntas, (1) y (2)
D) Cada una por sí sola, (1) ó (2)
E) Se requiere información adicional
∀ Para todo
∃ Existe
{a, b, c . . .} Conjunto formado por los elementos a, b, c . . .
∈ Pertenece
∉ No pertenece
⊂ Subconjunto
∪ Unión
∩ Intersección
A c Complemento de A
φ Conjunto vacío
R2 Plano cartesiano
R3 Espacio Euclidiano
(a, b) Par ordenado
(a, b, c) Trío ordenado
A × B Producto cartesiano entre A y B
N Números naturales
N0 Números cardinales
Z Números enteros
Q Números racionales
I Números irracionales
R Números reales
C Números complejos
= Igualdad
≡ Equivalencia
∼ Semejantes
≅ Congruentes
> Mayor que
< Menor que
1A 21 B 1A 21 B 1A 21 A 1C 21 C
2B 22 B 2B 22 E 2C 22 C 2D 22 A
3B 23 B 3E 23 C 3B 23 C 3A 23 D
4C 24 B 4A 24 E 4A 24 E 4A 24 D
5A 25 E 5E 25 D 5D 25 C 5C 25 A
6C 26 B 6C 26 A 6B 26 A 6C 26 A
7E 27 E 7D 27 E 7C 27 A 7B 27 C
8C 28 B 8C 28 C 8E 28 C 8B 28 B
9C 29 B 9D 29 B 9C 29 C 9D 29 D
10 C 30 B 10 A 30 C 10 E 30 C 10 C 30 A
11 B 31 E 11 D 31 B 11 E 31 D 11 E 31 C
12 A 32 A 12 B 32 D 12 D 32 B 12 D 32 C
13 D 33 C 13 C 33 C 13 D 33 D 13 E 33 A
14 D 34 D 14 C 34 C 14 B 34 C 14 D 34 E
15 E 35 D 15 B 35 A 15 D 35 A 15 B 35 B
16 C 36 E 16 A 36 B 16 E 36 C 16 D 36 B
17 C 37 D 17 D 37 A 17 D 37 E 17 C 37 A
18 C 38 B 18 A 38 C 18 C 38 E 18 B 38 B
19 B 39 C 19 A 39 B 19 A 39 D 19 B 39 E
20 B 40 A 20 E 40 A 20 B 40 A 20 D 40 D