Está en la página 1de 58

Apuntes de clase, Estadı́stica Descriptiva.

Luis Fernando González Saavedra

Dpto. de Matemáticas y Estadı́stica


Universidad de Córdoba.
Monterı́a, Córdoba Colombia.
lg1984078@gmail.com

2021

1
Introducción.

¿Qué es estadı́stica?

Un poco de historia
La estadı́stica que muchos consideran como algo nuevo, dado que hoy en dia
se fundamenta en el manejo de grandes cantidades de información o datos
de carácter estadı́sticos, pero su aplicación uso se remonta a la antiguedad,
pues hay indicios de su inicio en China donde el emperador Yao (2239 A de
C.) dispuso la realización de un Censo; algo similar ocurrió en la época del
Rey Herodes, relacionado con un empadronamiento (registro oficial en el que
constan los habitantes de una población)cuando se habló del nacimiento de
Jesús.

Otros textos aseguran que durante los años 3000 AC, los babilonios utiliza-
ban tablas de arcilla para llevar sus registros de la producción agrı́cola.

En el año 594 DC. Los romanos fueron los primeros en realizar un censo de
la población.

Para los años 1066 − 1086 DC, paı́ses como Inglaterra, Francia usaron la
estadı́stica para recopilar información sobre las extensiones de sus tierras.

En el siglo XV aproximadamente, Inglaterra publica una estadı́stica semanal


por un brote de peste, también llamada sudor inglés.

Para los siglos XVI, se les ordena a los clérigos que empiecen a registrar los
nacimientos, bautismos, matrimonios fallecimientos por sexo.

Para los siglos XVII matemáticos como Bernoulli y Laplace desarrollaron la


teorı́a de probabilidades.

Hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas Cientı́fi-


cos.

A principios del siglo XIX, el significado de estadı́stica fue ampliado para in-
cluir la disciplina que se ocupada de recolectar, resumir y analizar los datos.

Hoy la estadı́stica es ampliamente usada en todos los gobierno, los negocios


y todas las ciencias de la investigación.

2
El avance computacional ha permito a la estadı́stica realizar análisis a gran-
des volúmenes de datos.

La palabra estadı́stica, para algunos, proviene de la palabra status, que sig-


nifica estado; para otros se deriva del vocablo griego statera que significa
balanza, otra más confiable proviene de la palabra alemana Stara que signi-
fica estado, el encargado de hacer estadı́sticas.

Definición: La palabra estadı́stica se refiere a un sistema o método usado


en la recolección, organización, presentación y análisis de datos que permiten
sacar conclusiones, tomar decisiones y resolver problemas.También se puede
decir que la estadı́stica se encarga de estudiar hechos o fenómenos de grupo.

¿Para qué sirve la estadı́stica?

La estadı́stica ayuda a los ingenieros y cientı́ficos a:

- Diseñar nuevos productos y sistemas.

- Perfeccionar los existentes.

- Diseñar, desarrollar y mejorar procesos de producción.

- Aumentar la calidad de los productos.

¿Por qué es necesario estudiar estadı́stica?

Es necesario estudiar estadı́stica porque es necesario estudiar la variabilidad.

Variabilidad: Es el resultado de cambios en las condiciones bajo las cuales


se hacen las observaciones.

Ejemplos:

- Diferencias en las propiedades de los materiales.

- En la forma que trabajan los obreros.

- Desgaste y desajuste de las maquinarias.

- Factores ambientales: humedad, temperatura ambiente, radiación solar.

3
Conceptos Importantes.

Cuando se va a hacer uso de la estadı́stica, inicialmete tenemos 2 posibles


caminos; Estadı́stica Descriptiva y Estadı́stica Inferencial

Estadı́stica Descripitiva: La estadı́stica descriptiva nos enseña como re-


colectar, agrupar y presentar datos de una forma tal que los describa fácil y
rápidamente.

Estadı́stica Inferencial: Trata del contraste de hipótesis, encuestas me-


diante muestras y estimaciones para hacer inferencia sobre la población.

Población: Colección completa de todas las observaciones de interés para el


investigador.

Muestra: Parte (subconjunto)de la población que se selecciona para ser


estudiada ya que la población es demasiado grande para estudiarla en su
totalidad.

Parámetro: Medida descriptiva de la población.

Estadı́stico: Valor que describe una muestra y sirve como estimación de un


parámetro de la población correspondiente.

Variable: Caracterı́stica de los individuos de la población que se estudia.

Dato:Un dato o una observación es cada uno de los valores obtenidos al


realizar un estudio estadı́stico.

Clasificación de variables.

Variables Cuantitativas: Se refieren a cantidad, siempre pueden ser ex-


presadas por números.

Ejemplos: Estatura, edad, velocidad, peso, precio, ingresos, temperatura.

Variables Cualitativas: Se refieren a cualidad o carcteristı́ca, aunque se


pueden representar con números no indican cantidad.

Ejemplos: Opinión, preferencia, estado civil, religión, nivel de escolaridad,


rango, color.

4
Clasificación de variables Cuantitativas.

Cuantitativa Discreta: los valores se limitan a números enteros, por lo


general son el resultado de conteos.

Ejemplos:
Edad.
Número de hijos.
Goles por partido.

Cuantitativa Continua: Pueden tomar cualquier valor dentro de un inter-


valo numérico.

Ejemplos:
Estatura.
Peso.
precio.

Clasificación de variables Cualitativas.

Cualitativa Ordinal: son aquellas variables cualitativas que admiten un


criterio de orden.

Ejemplos:
Nivel de escolaridad.
Rango Militar.
Eatapa de la vida.

Cualitativa Nominal: son aquellas variables cualitativas que no admiten


un criterio de orden.

Ejemplos:
Religión.
Color.
Sexo.

5
Distribución de Frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en


forma de tabla de los datos estadı́sticos, asignando a cada dato su frecuencia
correspondiente.

En estadı́stica se usan dos tipos de tablas para organizar los datos.

Tablas por categorı́as o caracterı́sitcas: Se usan cuando la variable de


estudio es cualitativa o cuando se tiene una variable cuantitativa que toma
pocos valores distintos.

Tablas por intervalos: Se usan para organizar datos de una variable cuan-
titativa que toma muchos valores distintos.

Consideremos una muestra de n observaciones, descrita según una variable C


cuyas modalidades han sido agrupadas en un número k de categorı́as o clases,
que denotamos mediante C1 , C2 , ..., Ck . Para cada una de las categorı́as Ci
con i = 1, ..., k, introducimos los siguientes conceptos:

La frecuencia absoluta (fi ) es el número de veces que aparece un deter-


minado valor en un estudio estadı́stico. La suma de las frecuencias absolutas
es igual al número total de datos, que se representa por n.

f1 + f2 + · · · + fk = n

La frecuencia relativa (hi ) es el cociente entre la frecuencia absoluta de


un determinado valor y el número total de datos.
hi = fni la suma de las frecuencias relativas es 1.

h1 + h2 + · · · + hk = 1

La frecuencia absoluta acumulada (Fi ) es la suma de las frecuencias


absolutas de todos los valores inferiores o iguales al valor considerado.

F1 = f1 , F2 = f1 + f2 ,..., Fk = f1 + f2 + · · · + fk

6
La frecuencia relativa acumulada (Hi ) es el cociente entre la frecuencia
acumulada de un determinado valor y el número total de datos.

H1 = h1 , H2 = h1 + h2 ,..., Hk = h1 + h2 + · · · + hk

Teniendo los conceptos claros vistos anteriormente podemos organizar los


datos en la siguiente tabla.

Tabla de frecuancias para por categorı́as o caracterı́sitcas


Claes Frec. abs Frec. rel Frec. abs. acumulada Frec. rel. acumulada
ci fi hi Fi Hi
c1 f1 h1 F 1 = f1 H1 = h1
c2 f2 h2 F 2 = f1 + f2 H2 = h1 + h2
.. .. .. .. ..
. . . . .
ck fk hk F k = f1 + f2 + · · · + fk Hk = h1 + h2 + · · · + hk
Total n 1

Ejemplo: Se les preguntó a 20 personas por su color favorito, las respuestas


se muestran a continuación.

Negro Azul Amarillo Rojo Azul


Azul Negro Negro Amarillo Rojo
Rojo Azul Amarillo Rojo Amarillo
Rojo Azul Rojo Amarillo Negro
En este caso nuestra variable es el color favorito de un grupo de 20 personas,
es una variable cualitativa nominal.

La variable color toma 4 valores distintos y tenemos 20 observaciones de la


variable.

Tabla de frecuancias para la variable color


Color fi hi Fi Hi
5
Amarillo 5 20 = 0,25 5 0,25
4
Negro 4 20 = 0,20 5 + 4 = 9 0,25 + 0,20 = 0,45
6
Rojo 6 20 = 0,30 9 + 6 = 15 0,45 + 0,30 = 0,75
5
Azul 5 20 = 0,25 15 + 5 = 20 0,75 + 0,25 = 1
Total 20 1

7
Para facilitar la interpretación de la tabla se puede reemplazar la frecuencia
relativa por la frecuencia porcentual, veamos.

Tabla de frecuancias para la variable color


Color fi hi Fi Hi
Amarillo 5 25 % 5 25 %
Negro 4 20 % 9 45 %
Rojo 6 30 % 15 75 %
Azul 5 25 % 20 100 %
Total 20 100 %

Ejemplo: En una tienda de autos, se registra la cantidad de autos Toyota


vendidos en cada dı́a del mes de Septiembre.

0, 1, 2, 1, 2, 0, 3, 2, 4, 0, 4, 2, 1, 0, 3, 0, 0, 3, 4, 2, 0, 1, 1, 3, 0, 1, 2, 1, 2, 3.

Con los datos obtenidos, elaborar una tabla de frecuencias.

En este caso nuestra variable es el número de autos vendidos, es una variable


cuantitativa discreta y tenemos n = 30 observaciones.
La variable toma 5 valores distintos por lo que procedemos a construir una
tabla de frecuencia para datos agrupados puntualmente.

# de autos fi hi Fi Hi frec % frec %


vendidos acumulada
0 8 0,267 8 0,267 26, 7 % 26, 7 %
1 7 0,233 15 0,500 23, 3 % 50 %
2 7 0,233 22 0,733 23, 3 % 73, 3 %
3 5 0,167 27 0,900 16, 7 % 90 %
4 3 0,1 30 1 10 % 100 %
Total 30 1 100 %

En nuestro conjunto de datos el 0 aparece 8 veces, f1 = 8 representa el núme-


ro de dias que se vendieron 0 autos.

En nuestro conjunto de datos el 1 aparece 7 veces, f2 = 7 representa el núme-


ro de dias que se vendió 1 auto.

h1 = fn1 = 30
8
= 0,267, nos indica que el 26, 7 % de los dias del mes de sep-
tiembre se vendeieron 0 autos.

8
f2 7
h2 = n
= 30
= 0,233

F 1 = f1 = 8

F2 = f1 + f2 = 8 + 7 = 15, indica que 15 de los dias del mes de septiembre


se vendió como máximo 1 auto.

F3 = f1 + f2 + f3 = 8 + 7 + 7 = 22,indica que 22 de los dias del mes de


septiembre se vendieron como máximo 2 autos.

F4 = f1 + f2 + f3 + f4 = 8 + 7 + 7 + 5 = 27, 27 de los dias del mes de


septiembre se vendieron 3 autos o menos.

F5 = f5 + F4 = 3 + 27 = 30

H1 = h1 = 0, 267

H4 = h1 + h2 + h3 + h4 = 0, 267 + 0, 233 + 0, 233 + 0, 167 = 0, 9, indica que


el 90 % de los dias del mes de septiembre se vendieron 3 autos o menos.

Distribución de frecuencias agrupadas en intervalos.

Cuando la variable es cuantitativa y además toma muchos valores distintos,


se procede a construir una tabla de frecuencias para datos agrupados en in-
tervalos.

Para relizar este tipo de tablas hay que definir otros conceptos.

Linf : Lı́mite inferiror del intervalo.

Lsup : Lı́mite Superior del intervalo.

xi : Es la marca de clase del intervalo i, es el punto medio de dicho intervalo.

Linf + Lsup
xi =
2

9
Rango: Es la diferencia entre el máximo y el mı́nimo de los datos.

R = Xmax − Xmin

Pasos para construir una tabla de frecuecias para datos agrupados


en intervalos

1. Hallar el rango

2. Calular el numero de clases (intervalos) usando la Regla de Sturges


k = 1 + 3, 33 × log(n), n es el número de datos. k se aproxima al entero
más cercano.

3. Calcular la amplitud que tendrán todos los intervalos.


R
A=
k
4. El ultimo paso es construir la tabla de la siguiente forma

Intervalos Marca de clase


Linf - Lsup xi fi hi Fi Hi
[L1 − L2 ) x1 = L1 +L
2
2
f1 h1 F1 H1
[L2 − L3 ) x2 = L2 +L
2
3
f2 h2 F2 H2
.. .. .. .. .. ..
. . . . . .
Lk +Lk+1
[Lk − Lk+1 ] xk = 2
fk hk Fk Hk
Total n 1

Construcción de los intervalos

- Los intervalos se construyen ceerados por la izquierda y abiertos a la


derecha, [Li − Li+1 )

- El ultimo de la tabla es completamente cerrado [Lk − Lk+1 ]

- El lı́mite inferior del primer intervalo es el mı́nimo de los datos, L1 =


Xmin y el lı́mimite superior de ese mismo intervalo es L2 = L1 + A,
donde A es la amplitud.

- Los lı́mites inferiror y superior del segundointervalo serán; L2 y L3 =


L2 + A

10
- Se sigue el mismo procedimiento hasta llegar al intervalo k.

Importante: Se debe tener en cuenta que en las tablas de frecuecias para


datos agrupados en intervalos, las frecuencias no representan la cantidad de
veces que un dato aparece, sino que representan la cantidad de datos que
están contenidos en un intervalo determinado.

Ejemplo: La nota final de 60 estudiantes de un curso de estadiı́stica fue:

0,8 1,2 1,3 1,4 1,4 1,5 1,5 1,6 1,7 1,7
1,8 1,9 2,0 2,0 2,2 2,4 2,5 2,5 2,7 2,7
2,7 2,8 2,9 2,9 3,0 3,0 3,1 3,2 3,2 3,3
3,3 3,3 3,3 3,4 3,5 3,5 3,5 3,5 3,5 3,5
3,5 3,6 3,6 3,7 3,7 3,8 3,8 3,9 3,9 3,9
3,9 4,0 4,0 4,0 4,0 4,2 4,2 4,5 4,7 5

Elabore una tabla de frecuencias.

Tenemos n = 60 datos, procedemos a calcular el rango

R = Xmax − Xmin = 5 − 0, 8 = 4, 2
Ahora se calcula el número de intervalos

k = 1 + 3, 3 × log(n) = 1 + 3, 3 × log(60) = 6, 87 ≈ 7
Y la amplitud

R 4, 2
A= = = 0, 6
k 7
Luego,

L1 = Xmin = 0, 8
L2 = L1 + A = 0, 8 + 0, 6 = 1, 4
L3 = 1, 4 + 0, 6 = 2, 0
L4 = 2, 0 + 0, 6 = 2, 6
L5 = 2, 6 + 0, 6 = 3, 2
L6 = 3, 2 + 0, 6 = 3, 8

11
L7 = 3, 8 + 0, 6 = 4, 4
L8 = 4, 4 + 0, 6 = 5

L1 +L2 0,8+1,4
x1 = 2
= 2
= 1, 1
L2 +L3 1,4+2,0
x2 = 2
= 2
= 1, 7
L3 +L4 2,0+2,6
x3 = 2
= 2
= 2, 3

Procedemos a construir la tabla

Notas xi f i hi Fi Hi
[0, 8 − 1, 4) 1,1 3 0,05 3 0,05
[1, 4 − 2, 0) 1,7 9 0,15 12 0,2
[2, 0 − 2, 6) 2,3 6 0,1 18 0,3
[2, 6 − 3, 2) 2,9 9 0,15 27 0,45
[3, 2 − 3, 8) 3,5 18 0,3 45 0,75
[3, 8 − 4, 4) 4,1 12 0,2 57 0,95
[4, 4 − 5, 0] 4,7 3 0,05 60 1
Total 60 1

Interprete f2 , h5 , F3 y H5

. f2 = 9
9 de los 60 estudiantes del curso de estadı́stica, obtuvieron una nota
mayor o igual a 0,8 y menor que 1,4.

. h5 = 0, 3
El 30 % de los estudiates del curso, obtuvieron notas entre 3,2 y 3,8
(sin incluirlo).

. F3 = 18
18 estudiantes obtuvieron notas inferiores a 2,6

. H5 = 0, 75
El 75 % de los estudiastes obtuvo notas mayores o iguales a 0,8 e infe-
riores a 3,8

12
Ejercicio: Con la siguiente información elabore una tabla de recuencias e
interpretela

Una nueva aleación de aluminio litio está siendo evaluada como posible mate-
rial para la fabricación de elementos estructurales de aeronaves. Los datos de
resistencia a la tensión, en libras por pulgada cuadrada (psi), de 80 muestras
se transcriben en la siguiente tabla.

105 97 245 163 207 134 218 199 160 196


221 154 228 131 180 178 157 151 175 201
183 153 174 154 190 76 101 142 149 200
186 174 199 115 193 167 171 163 87 176
121 120 181 160 194 184 165 145 160 150
181 168 158 208 133 135 172 171 237 170
180 167 176 158 156 229 158 148 150 118
143 141 110 133 123 146 169 158 135 149

13
Repepresentación Gráfica de Datos.

Las tablas estadı́sticas representan toda la información de modo esquemáti-


co y están preparadas para los cálculos posteriores. Los gráficos estadı́sticos
nos transmiten esa información de modo más expresivo, con un sólo gol-
pe de vista, entender de que se nos habla, observar sus caracterı́sticas más
importantes, incluso sacar alguna conclusión sobre el comportamiento de la
muestra donde se esta realizando el estudio.
Los gráficos estadı́sticos son muy útiles para comparar distintas tablas de
frecuencia.

Diagrama circular
Para variables cualitativas o para variables cuantitativas con valores agrupa-
dos por clases, se pueden elaborar gráficos circulares divididos en sectores,
tambien llamada Gráfica de Pastel.
Estas gráficas tienen la siguiente forma general:

Para elaborar este gráfico es necesario calcular el ángulo que le corresponde


a cada clase.
Si se tienen n observaciones y fi es la frecuencia absoluta de la clase ci , en-
tonces el ángulo de la clase ci es

fi
× 360◦
n
o

hi × 360◦

14
Diagrama de barras
Se utiliza para la representación de variables cuantitativas discretas o va-
riables agrupadas por categorı́as, cada valor o clase de se representa por un
punto sobre el eje X y sobre él se dibuja una barra de longitud igual o pro-
porcional a su frecuencia absoluta

Histograma
Es una gráfica de barras en el caso donde los valores o clases de la variable
tienen un orden, es decir, se usa para variables cuantitativas y cualitativas
ordinales.

Polı́gono de frecuencias.
Dado un histograma, se marcan los puntos medios de la parte superior de
la barras y se unen los puntos con lineas rectas, a la gráfica resultante se le
llama polı́gono de frecuencias.

15
Polı́gono de frecuencias acumuladas.
Se construye a partir de un histograma de frecuencias acumuladas.

16
Ojiva.
A partir de un polı́gono de frecuencias acumuladas, a la gáfica que resulta
de trazar una curva suavesobre los puntos de cada barra se le llama Ojiva.

17
Medidas de tendencia Central.

Las medidas de tendencia central (o de centralización) son medidas que tien-


den a localizar en la parte central de un conjunto ordenado de datos de una
variable cuantitativa.

Entre las más usadas tenemos: Media Aritmética o Promedio, Mediana


y Moda

Media Aritmética: Sean x1 , x2 , . . . , xn , n observaciones o mediciones de


una variable cuantitativa. La media es el número
n
X
xi
x 1 + x2 + · · · + xn i=1
x̄ = =
n n

Ejemplo: En una población se estudia la variable “Estatura”, para ello se


cuenta con una muestra n = 4 estudiantes; x1 = 1,70, x2 = 1,65, x3 = 1,85,
x4 = 1,70. El promedio de Estatura es:

1,70 + 1,65 + 1,85 + 1,70 6,9


x̄ = = = 1,725
4 4

Algunas propiedas de la media aritmética

1. Si tenemos un conjunto de observaciones x1 , x2 , . . . , xn cuya media es


x̄ y a cada una de esas observaciones se les suma una constante C, la
media de los datos x1 + C, x2 + C, . . . , xn + C es x̄ + C

2. Si tenemos un conjunto de observaciones x1 , x2 , . . . , xn cuya media es x̄


y a cada una de esas observaciones se les multiplica por una constante
a, la media de los datos ax1 , ax2 , . . . , axn es ax̄

Para emplear las dos propiedades anteriores, vamos a considerar la siguiente


situación

A causa de la extensión en el número de horas en sus jornadas laborales, el


propiestario de un restaurante promete a sus empleados que para el mes de
noviembre les dará una bonificación de 300 mil pesos adicionales a todos y

18
que por el mes de diciembre les duplicará el salario.

Los salarios de los empleados, en millones de pesos, se muestran en la si-


guiente tabla.

Cargo Salario
Cocinero 1,5
Mesero 1 1,2
Mesero 2 1,2
Cajero 1,3
Domiciliario 1
Suma 6,2

El promedio de salarios es
n
X
xi
i=1 6, 2
x̄ = = = 1, 24
n 5

Ahrora nos interesa promedio de los salarios para el mes de noviembre, le


sumamos la bonificación de 300 mil a cada uno de los salarios y el resultado
es el siguiente

Cargo Salario Noviembre


Cocinero 1,8
Mesero 1 1,5
Mesero 2 1,5
Cajero 1,6
Domiciliario 1,3

1, 8 + 1, 5 + 1, 5 + 1, 6 + 1, 3 7, 7
x̄ = = = 1, 54
5 5
Si hacemos uso de la propiedad 1, tenemos que la media es 0, 3 + x̄ =
0, 3 + 1, 24 = 1, 54

Para el mes de Diciembre los salarios iniciales se duplicaran, entonces la


media de salarios será:

19
3 + 2, 4 + 2, 4 + 2, 6 + 2 12, 4
x̄ = = = 2, 48
5 5
Si hacemos uso de la propiedad 2, tenemos que la media es 2x̄ = 2 × 1, 24 =
2, 48

Hay que dejar claro que lo anterior no es la prueba de que esas propiedades
se cumplen, son simples ejemplos de como darle uso a esas propiedades y que
lo siguiente puede resumir esas dos propiedades en una sola expresión.

Sean x1 , x2 , . . . , xn , n observaciones o mediciones de la variable cuantitativa


X y sea x̄ la media muestral. Sean y1 , y2 , . . . , yn , n mediciones de la variable
Y con yi = axi + c donde a y c son constantes, entonces ȳ = ax̄ + c.

Mediana: Sean x1 , x2 , . . . , xn , n observaciones o mediciones de una variable


cuantitativa. Sean x(1) , x(2) , . . . , x(n) las observaciones ordenadas de menor a
mayor incluyendo repeticiones, la mediana es el número


 x( n+1

2 )
si n es impar
Me =
 x( n ) +x( n +1)
2 2
si n es par

2

Ejemplo: Considere las siguiestes observaciones

1,65 1,65 1, 70 1,72 1,74

n = 5, un número impar.La mediana de este conjunto de datos es el valor


que está en la posición n+1
2
= 5+1
2
=3

Me = x( n+1 ) = x(3) = 1, 70
2

Ejemplo: Ahora considere un conjunto de datos de tamaño 6

1,65 1,65 1, 70 1,72 1,74 1, 82

20
n = 6, un número par. Debemos encontrar las observaciones en la posición
n
2
y n2 + 1, es decir, buscamos las observaciones en las posiciones 3 y 4.

x( n2 ) + x( n2 +1) x(3) + x(4) 1, 70 + 1, 72


Me = = = = 1, 71
2 2 2

Propiedades de la Mediana

1. Puede ser una de las observaciones o no serlo.

2. La mediana es un valor central que separa un conjunto de datos en dos


partes, ambas con el mismo número de observaciones

3. La mediana es robusta a valores extremos.

4. Si tenemos un conjunto de observaciones x1 , x2 , . . . , xn cuya mediana


es Me y a cada una de esas observaciones se les suma una constante C,
la mediana de los datos x1 + C, x2 + C, . . . , xn + C es Me + C

5. Si tenemos un conjunto de observaciones x1 , x2 , . . . , xn cuya mediana


es Me y a cada una de esas observaciones se les multiplica por una
constante a, la mediana de los datos ax1 , ax2 , . . . , axn es aMe

Para la ilustrar la propiedad 3, consideraremos los siguientes conjuntos de


datos.

Conjunto 1 9 8 2 3 10 12
Conjunto 2 9 8 3568 2 3 12

La media y mediana del conjunto 1 son, 7,33 y 8,5

para el conjunto 2, la media es 600,33 y la mediana sigue siendo 8,5.

Moda: La Moda (Mo ) es el valor que aparece con mayor frecuencia en el


conjunto de datos, si lo hubiera.

Ejemplo: Cosideremos los siguientes tres conjuntos de datos.

21
Conjunto 1 1,5 2,0 2,1 1,7 2,2
Conjunto 2 1,3 1 1,3 2 2,5
Conjunto 3 1,2 1,2 1,5 2 1,5

El primer conjunto de datos no tiene moda.


En el conjunto 2, Mo = 1, 3
El conjunto 3 es bimodal, es decir, hay dos modas que son 1,2 y 1,5.

Las medidas de tendencia central no son suficientes para describir un con-


junto de datos, veamos

En las siguiente tabla se presentan el número de pases correctos en campo


rival de los 5 jugadores con función ofensiva de 2 equipos de fútbol

Equipo 1 Equipo 2
16 4
16 6
18 18
18 30
24 34
x̄ = 18, 4 x̄ = 18, 4
Me = 18 Me = 18

Aunque la media y la mediana son igules para los dos conjuntos de datos, a
simple vista se ve diferencia entre ellos.

22
Medidas de dispersión.

Las medidas de dispersión o variabilidad permiten establecer que tan disper-


sos están entre si un conjunto de datos observados con respecto a un valor
central.

Entre las más conocidas tenemos: Rango, Varianza, Desviacón Estándar y


Coeficiente de Variación.

Rango: Es la diferencia entre el máximo y el mı́nimo de los datos.

R = Xmax − Xmin
El rango tampoco es suficiente, vemos

Conjunto 1 1 2 3 4 5 6 7 8 100
Conjunto 2 1 20 30 40 60 70 80 90 100

El rango R = 99 es igual para ambos conjuntos de datos, pero se observa que


los datos del conjunto 2 están más dispersos. Es necesario estudiar medidas
de dispersión que tengan en cuenta a todos los datos del conjunto.

Varianza: Sean x1 , x2 , . . . , xn , n observaciones o mediciones de una variable


cuantitativa y x̄ la media, se define a la varianza como sigue
n
X
(xi − x̄)2 n
!
2 i=1 1 X
var(X) = SX = = x2i − nx̄2
n−1 n−1 i=1

Propiedades de la Varianza

1. var(X) ≥ 0

2. var(X + a) = var(X), siendo a una constante

3. var(aX) = a2 var(X)

23
Desviación Estándar: Es la raiz cuadrada de la varianza

v
u n
uX
q
u
u (xi − x̄)2
2
t i=1
de(X) = SX = SX =
n−1

Propiedades de la Desviación Estándar

1. de(X) ≥ 0

2. de(X + a) = de(X), siendo a una constante

3. de(aX) = |a| de(X)

Coeficiente de Variación: Es el cociente entre la desviación estándar y el


valor absoluto de la media.
Sx
cv = × 100 %
|x̄|

Ejemplo: Considere los siguientes datos 3, 2, 5, 4.

3+2+5+4
x̄ = = 3, 5
4

La varianza

2 (3 − 3, 5)2 + (2 − 3, 5)2 + (5 − 3, 5)2 + (4 − 3, 5)2 5


SX = = = 1, 67
4−1 3

La desviación estándar
q p
2
SX = SX = 1, 67 = 1, 29

El coeficiente de variación

24
Sx 1, 29
cv = × 100 % = × 100 % = 36, 9 %
|x̄| |3, 5|

¿Qué interpretación le doy a las medidas de dispersı́on?

- La varianza mide la dispersión de un conjunto de datos respecto de su


media, si se comparan 2 conjuntos de datos y uno tiene menor varianza,
se concluye que ese conjunto de datos tiene menor dispersión.
- La desviacı́on estándar mide lo mismo que la varianza, pero con la
ventaja de que el resultado que se obtiene tiene las mismas unidades
de medición que los datos originales.
- El coeficiente variación nos informa a cerca de la dispersión porcentual
de un conjunto de datos, si el cv ≤ 20 % se puede decir que los datos
son homogéneos, si el cv > 20 % se puede decir que los datos son
heterogéneos.

Siguiendo con el ejemplo de el número de pases correctos en campo rival de


los 5 jugadores con función ofensiva de 2 equipos de fútbol

Equipo 1 Equipo 2
16 4
16 6
18 18
18 30
24 34
x̄ = 18, 4 x̄ = 18, 4
2 2
SX = 10, 8 SX = 184, 8
SX = 3, 29 SX = 13, 59
cv = 17, 86 % cv = 73, 88 %
El promedio de pases acertados en campo rival es igual para ambos equipos,
pero en el equipo 2 hay más variación entre la cantidad de pases que acertó
un jugador y otro, la cantidad de pases acertados por los jugadores del equi-
po 1 son homogéneos, la cantidad de pases acertados por los jugadores del
equipo 2 son heterogéneos.

25
Medidas de posición.

Son cantidades que ayudan a entender cómo es la distribución de un conjunto


de datos numéricos.

Sean x1 , x2 , . . . , xn , n observaciones o mediciones de una variable cuantita-


tiva. Sean x(1) , x(2) , . . . , x(n) las observaciones ordenadas de menor a mayor
incluyendo repeticiones.

Cuartiles: El k-ésimo cuartil k = 1, 2, 3, denotado por Qk es un valor tal


que al menos k4 100 % de los datos es menor o igual que él y al menos el
1 − k4 100 % de los datos es mayor o igual que él.

Q1 es el primer cuartil
Q2 es el segundo cuartil
Q3 es el segundo cuartil.

Deciles:El k-ésimo decil k = 1, 2, 3, · · · , 9, denotado por Dk es un valor tal


k
que al menos 10 100 % de los datos es menor o igual que él y al menos el
k
1 − 10 100 % de los datos es mayor o igual que él.

D1 es el primer decil
D2 es el segundo decil
..
.
D9 es el noveno decil

Percentiles:El k-ésimo percentil k = 1, 2, 3, · · · , 99, denotado por Pk es un


valor tal que al menos k · 100 % de los datos es menor o igual que él y al
menos el (1 − k) 100 % de los datos es mayor o igual que él.

P1 es el primer percentil
P2 es el segundo percentil
..
.
P99 es el percentil 99

Los cuartiles y deciles son percentiles, entonces solo calcularemos percentiles.

26
Para calcular el k-ésimo percentil, el primer paso es ordenar los datos, luego
k·n
se busca la posición 100 . Si el resultado es un número entero entonces, el
k-ésimo percentil es el promedio dicha posición con la siguiente, es decir,
x( k·n ) + x( k·n +1)
100 100
Pk =
2
k·n
Si el resultado de 100
no es entero, se aproxima al siguiente entero y la ob-
servación en esa posición será el percentil Pk .

Ejemplo: La demanda diaria, en kilogramos, de un producto industrial du-


rante 30 dı́as fue:

38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56

Calcular el primer cuartil, el tecer decil y el percentil 90

Solución
Los datos ordenados son:

25 28 32 33 35 36
38 42 44 44 47 48
48 49 51 52 53 56
57 58 58 59 61 63
66 67 69 72 76 78

Para hallar el primer cuartil o el percentil 25 Q1 = P25 , buscamos la posición


k·n 25 × 30
= = 7, 5
100 100
El percentil es la observacı́on en la posición 8, entonces Q1 = P25 = 42

Para hallar el tercer decil o el percentil 30 D3 = P30 , buscamos la posición


k·n 30 × 30
= =9
100 100
27
Procedemos a promediar las observaciones en las posiciones 9 y 10.
x(9) + x(10) 44 + 44
D3 = P30 = = = 44
2 2

28
Medidas de tendecia central, dispersión y posición, para
datos agrupados.

Sean x1 , x2 , · · · , xn , n mediciones de una variable cuantitativa agrupada en


una tabla de distribución de frecuencias con k clases, donde fi son las fre-
cuencias absolutas y xi las marcas de clase o puntuaciones de la variable.

Importante: Si la variable está agrupada puntualmente, como en el ejemplo


del número de autos Toyota vendidos, xi representará los valores que toma
la variable.
Si la variable está agrupada por intervalos, como en el ejemplo de las notas
del curso de estadı́stica, xi representa las marcas de clase.

Media para datos agrupados.


k
X
xi · f i
i=1
x̄ =
n

Mediana para datos agrupados.


Si la variable está agrupada puntualmente, la mediana será el primer valor
cuya frecuencia absoluta acumulada iguale o supere a n2 .

Si la variable está agrupada por intervalos, la mediana será


n
2
− Fi−1
Me = Li + ×A
fi

Donde

Li es el lı́mite inferior del intervalo que contiene a la mediana

Fi−1 es la frecuencia absoluta acumulada anterior al intervalo que con-


tiene a la mediana

fi es la frecuencia absoluta del intervalo que contiene a la mediana

A es la amplitud

El intervalo que contiene a la mediana es aquel cuya frecuencia absoluta


acumulada sea la primera en igualar o superar a n2

29
Moda para datos agrupados.
Si la variable está agrupada puntualmente, la moda será el valor con mayor fi .

Si la variable está agrupada por en intervalos, la moda es


fi − fi−1
Mo = Li + ×A
(fi − fi−1 ) + (fi − fi+1 )

Donde

Li es el lı́mite inferior del intervalo que contiene a la moda

fi es la frecuencia absoluta del intervalo que contiene a la moda

fi−1 es la frecuencia absoluta anterior al intervalo que contiene a la


moda

fi+1 es la frecuencia absoluta siguiente al intervalo que contiene a la


moda

A es la amplitud

El intervalo que contiene a la moda es el intervalo con mayor fi

Varianza para datos agrupados.


k
X
(xi − x̄)2 · fi
2 i=1
var(X) = SX =
n−1

Desviación Estándar para datos agrupados.


v
u k
uX
q
u
u (xi − x̄)2 · fi
i=1
2
t
de(X) = SX = SX =
n−1

30
Coeficiente de Variación para datos agrupados.
Sean x̄ y SX , la media y la desviación estandar para datos agrupados, el
coeficiente de variación se define como sigue

Sx
cv = × 100 %
|x̄|

Percentiles para datos agrupados.

Si la variable está agrupada puntualmente, el percentil k-ésimo será aquella


puntuación cuya frecuencia absoluta acumulada iguale o supere la cantidad
k·n
100

Si la variable está agrupada por intervalos, el percentil k-ésimo es:


k·n
100
− Fi−1
Pk = Li + ×A
fi
Con k = 1, 2, 3, · · · , 99

Donde
Li es el lı́mite inferior del intervalo que contiene al k-ésimo percentil
Fi−1 es la frecuencia absoluta acumulada anterior al intervalo que con-
tiene al k-ésimo percentil
fi es la frecuencia absoluta del intervalo que contiene al k-ésimo per-
centil
A es la amplitud
El intervalo que contiene al k-ésimo percentil aquel cuya frecuencia
k·n
absoluta acumulada sea la primera en igualar o superar a 100

Ejemplo: En una tienda de autos, se registra la cantidad de autos Toyota


vendidos en cada dı́a del mes de Septiembre. La siguiente es la tabla de fre-
cuencias que se obtuvo.

31
# de autos vendidos fi hi Fi Hi frec % frec %
xi acumulada
0 8 0,267 8 0,267 26, 7 % 26, 7 %
1 7 0,233 15 0,500 23, 3 % 50 %
2 7 0,233 22 0,733 23, 3 % 73, 3 %
3 5 0,167 27 0,900 16, 7 % 90 %
4 3 0,1 30 1 10 % 100 %
Total 30 1 100 %

Hallar las medidas de tendencia central, de dispersión, el tercer cuartil y el


percentil 73.

Solución

k
X
xi · f i
i=1 0·8+1·7+2·7+3·5+4·3 48
x̄ = = = = 1, 6
n 30 30
Como 0 es la puntuación con mayor frecuencia, Mo = 0

n
2
= 30
2
= 15, como 1 es la primer puntuación cuya frecuencia absoluta acu-
mulada iguala a 15, entonces Me = 1

k
X
(xi − x̄)2 · fi
2 i=1
SX =
n−1
(0 − 1, 6)2 · 8 + (1 − 1, 6)2 · 7 + (2 − 1, 6)2 · 7 + (3 − 1, 6)2 · 5 + (4 − 1, 6)2 · 3
=
30 − 1
51, 12
=
29
= 1, 766
p
Sx = 1, 766 = 1, 329

1, 329
cv = × 100 % = 83, 05 %
1, 6

32
Para hallar el tercer cuartil, Q3 = P75 , buscamos el primer Fi que iguale o
k·n
supere la cantidad 100 = 75·30
100
= 22, 5. Luego

Q3 = P75 = 3

P73 = 2

Ejemplo: La nota final de 60 estudiantes de un curso de estadı́stica se pre-


senta en la siguiente tabla

Notas xi f i hi Fi Hi
[0, 8 − 1, 4) 1,1 3 0,05 3 0,05
[1, 4 − 2, 0) 1,7 9 0,15 12 0,2
[2, 0 − 2, 6) 2,3 6 0,1 18 0,3
[2, 6 − 3, 2) 2,9 9 0,15 27 0,45
[3, 2 − 3, 8) 3,5 18 0,3 45 0,75
[3, 8 − 4, 4) 4,1 12 0,2 57 0,95
[4, 4 − 5, 0] 4,7 3 0,05 60 1
Total 60 1

Hallar las medidas de tendencia central, de dispersión y los 3 cuartiles.

Solución

k
X
xi · f i
i=1
x̄ =
n
1, 1 · 3 + 1, 7 · 9 + 2, 3 · 6 + 2, 9 · 9 + 3, 5 · 18 + 4, 1 · 12 + 4, 7 · 3
=
60
184, 8
=
60
= 3, 08

33
n 60
Para hallar la mediana, calculamos la cantidad 2
= 2
= 30, luego buscamos
el primer Fi que iguale o supere a 30

Luego,

n
2
− Fi−1
Me = Li + ×A
fi
60
− 27
= 3, 2 + 2 × 0, 6
18
= 3, 3

Para hallar el intervalo de la moda, es necesario ubicar el intervalo con mayor


frecuencia

Luego,

34
fi − fi−1
Mo = Li + ×A
(fi − fi−1 ) + (fi − fi+1 )
18 − 9
= 3, 2 + × 0, 6
(18 − 9) + (18 − 12)
= 3, 56

k
X
(xi − x̄)2 · fi
2 i=1
SX =
n−1
(1, 1 − 3, 08)2 · 3 + (1, 7 − 3, 08)2 · 9 + · · · + (4, 7 − 3, 08)2 · 3
=
60 − 1
56, 376
=
59
= 0, 956
p
Sx = 0, 956 = 0, 978

0, 978
cv = × 100 % = 31, 74 %
3, 08

25·60
Para hallar el primer cuartil o percentil 25, calculamos la cantidad 100
= 15
y luego se localiza el intervalo que contiene al primer cuartil.

Ası́,

35
k·n
− Fi−1
100
Q1 = Li + ×A
fi
15 − 12
=2+ × 0, 6
6
= 2, 3

Q2 = Me = 3, 3

Q3 = 3, 2

36
Diagrma de cajas y bigotes (Boxplot).

El diagrama de caja para un conjunto de datos revela información respecto


a la magnitud de la dispersión, localización de la concentración, simetrı́a de
los datos y determinar si existen datos atı́picos en la muestra.

Datos atı́picos: Son valores extremos o que difieren mucho de los demás
datos dentro de un conjunto, regularmente son ocasionados por opiniones
extremas, errores de medición o registro, acontecimientos extraordinarios o
condiciones desconocidas.

El box plot consiste en una caja y guiones, con una linea a través de la
caja que representa la mediana (segundo cuartil Q2 ).

El extremo inferior de la caja es el primer cuartil Q1

El extremo superior es el tercer cuartil Q3 .

El bigote superior se extiende desde el tercer cuartil hasta la observación


más grande que es menor o igual que Q3 + 1, 5 · (Q3 − Q1 ).

El bigote inferior se extiende hasta la observación más pequeña que es


mayor o igual que Q1 − 1, 5 · (Q3 − Q1 ).

Las observaciones que estén por fuera de estos lı́mites se clasifican como
datos atı́picos y se ubican en el diagrama.

A la diferencia entre el tercer cuartil y el primer cuartil, se le conoce


como rango intercuartı́lico. RIC = Q3 − Q1

37
Un diagrama de caja tiene la siguiente forma.

Interpretación

Mientras más larga es la caja y los bigotes, más dispersa es la distribución


de datos en ese punto.

La lı́nea que representa la mediana indica la simetrı́a. Si está relativamente


en el centro de la caja la distribución es simétrica, si por el contrario se acer-
ca al primer o tercer cuartil, la distribución pudiera ser sesgada a la derecha
(asimétrica positiva) o sesgada a la izquierda (asimétrica negativa respecti-
vamente).

Ejemplo: Considere las siguientes observaciones y veamos el diagrama de


cajas

-10, 1, 2, 3, 4, 5, 6, 7, 8, 9, 45.

Q1 = 2, Me = 5 y Q3 = 8

38
Q1 − 1, 5 · (Q3 − Q1 ) = 2 − 1, 5 ∗ (8 − 2) = −7

Q3 + 1, 5 · (Q3 − Q1 ) = 8 + 1, 5 ∗ (8 − 2) = 17
Los valores que sean inferiores a -7 o superiores a 17, serán considerados da-
tos atı́picos.

Ahora considere estos tres grupos de observaciones.

39
Grupo 1 Grupo 2 Grupo 3
1 1 -10
2 2 1
3 2 2
4 1 3
5 5 4
6 15 5
7 17 6
8 9 7
9 24 8
9
45

Las observaciones de los grupos 1 y 3 tienen una distribución simétrica,


hay mayor dispersión en las observaciones del grupo 2 y su distribucı́on es
asimétrica negativa, en el grupo 3 se observa la presencia de valores atı́picos.

40
Repaso conjuntos.

Conjuntos
Un conjunto es una colección de objetos o elementos con una caracterı́stica
común. Los denotaremos con las letras mayúsculas.

Ejemplos

. El cojunto de las vocales V = {a, e, i, o, u}

. El conjunto de los números naturales N = {1, 2, 3, 4, 5, ...}

. El conjunto de los numeros enteros Z = {..., −3, −2, −1, 0, 1, 2, 3, ...}

Relación de pertenencia y relación de contenencia

Si x es uno de los elementos que conforma al conjunto A, escribiremos x ∈ A


y se lee, x pertenece a A. Si x no pertenece a A, escribiremos x 6∈ A

Ejemplos. Sea A = {1, 3, 5}

1 ∈ A, 3 ∈ A, 5 ∈ A y 2 6∈ A

Si todos los elementos de un conjunto A pertenecen a un conjunto B, diremos


que A está contenido en B o que A es subconjunto de B y se denota, A ⊂ B.
Si A no está contenido en B, escribiremos A 6⊂ B.

Ejemplos. Sea A = {1, 3, 5, 7, 9}, B = {3, 5} y C = {5, 7, 9, 3, 1}


B ⊂ A, A 6⊂ B , A ⊂ C y C ⊂ A.

Propiedad. Sean X y Y concjuntos tales que, X ⊂ Y y Y ⊂ X si y solo si


X=Y

Conjuntos particulares

El conjunto universal, usualente denotado por la letra U, es el conjunto


que contiene a todos los conjuntos.

El conjunto vacı́o, denotado por ∅, es el conjuntoque no tiene ningún ele-


mento.

41
El conjunto complemento o complemento de un conjunto, por ejemplo,
sea A un conjunto, el complemento de A lo denotaremos por Ac . Ac está for-
madopor todos los elementos que pertenecen al universo pero no pertenece
a A, es decir, Ac es lo que le falta a A para ser el universo.

Ejemplo Sea U el conjunto universal tal que U = {1, 2, 3, 4, 5}.

Sean A = {1, 3, 5} y B = {1, 2}, entonces Ac = {2, 4} y B c = {3, 4, 5}

Algunas operaciones entre conjuntos

Unión: La unión entre dos o más cojuntos da como resultado otro conjunto,
formado por todos los elementos (sin repetición) de todos los conjuntos que
participaron en la opercación. La unión de dos conjuntos A y B, se denota
por A ∪ B.

Ejemplos
Sean A = {1, 2, 3, a, b}, B = {1, 2, 4, 10} y C = {b, c}

A∪B = {1, 2, 3, 4, 10, a, b}, A∪C = {1, 2, 3, a, b, c} y B ∪C = {1, 2, 4, 10, b, c}

Intersección: La interseción entre dos o más cojuntos da como resultado


otro conjunto, formado por todos los elementos en común de dichos conjun-
tos. La interseccı́on de dos conjntos A y B, se denota por A ∩ B.

Ejemplos
Sean A = {1, 2, 3, a, b}, B = {1, 2, 4, 10} y C = {b, c}

A ∩ B = {1, 2}, A ∩ C = {b} y B ∩ C = ∅

Diferencia: La diferencia entre dos conjuntos A y B, denotada por A − B,


es un conjunto formado por los elementos que pertenecen a A, pero no per-
tenecen a B.

Ejemplos
Sean A = {1, 2, 3, a, b} y B = {1, 2, 4, 10}

A − B = {3, a, b} y B − A = {4, 10}

Conjuntos disyuntos o ajenos: Dos conjuntos son disyuntos cuando no

42
tienen ningún elemento en común, es decir, su intersección es vacı́o.

Sean A y B conjuntos tales que, A ∩ B = ∅, diremos que A y B son disyuntos.

Cardinalidad de un cojunto: La cardinalidad de un conjunto es la medida


del número de elementos en el conjunto

Sean A = {1, 2, 3} y B = {a, e, i, o}. La cardinalidad de A es 3 y la cardina-


lidad de B es 4 La denotaremos como #A = 3 y #B = 4

Conjunto potencia: El conjunto potencia de un conjunto A es otro con-


junto formado por todos los subconjuntos del conjunto A. También llamado
conjunto de las partes de A o partes de A y se denota por ρ(A)

Ejemplos: Sean A = {1, 2, 3} y B = {a, e, i, o}

ρ(A) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}
y

ρ(B) ={∅, {a}, {e}, {i}, {o}, {a, e}, {a, i}, {a, o}, {e, i}, {e, o},
{i, o}, {a, e, i}, {a, e, o}, {a, i, o}, {e, i, o}, {a, e, i, o}}

La cardinalidad del conjunto potencia

#ρ(A) = 2#A
Se puede notar que, en el ejemplo anterior #A = 3 y #ρ(A) = 23 = 8.
#B = 4 y #ρ(B) = 24 = 16

Ejercicios

1. En una encuesta realizada a un grupo de deportistas, a cerca de prefe-


rencias deportivas se encontró losiguiente: 23 prefieren futbol, 21 basquet ,
26 voleybol, 7 prefieren basket y voleybol, 8 prefieren basquet y elfutbol, 12
prefieren futbol y voleybol y 5 prefieren los 3 deportes. ¿Cuántos deportitas
de los entrevistados prefiere solo un deporte?

Solución
Con lainformacı́on dada, se construye el siguiente diagrama de venn

43
F B
3
8 11
5
7 2
12
V
U

Los que solo prefieren futbol son 8, los que solo prefieren basket son 11 y
los que solo prefieren voleybol son 12, de modo que los que solo prefieren un
deporte son 8+11+12 = 31.

2. De 260 estudiantes de 7mo semestre de Ing Mecánica de la Universidad


de Córdoba, 80 están haciendo un curso cocina, 96 están haciendo un curso
de seguridad en el trabajo y 50 están haciendo un curso de idiomas. En la
misma información se encontró que algunos están haciendo 2 cursos a la vez:
cocina y seguridad 35, cocina e idiomas 20, seguridad e idiomas 15. Además
8 están haciendo los 3 cursos al tiempo.

Encuentre cuántos

a) no están haciendo ningún curso


b) Están haciendo el curso de cocina o seguridad
Solución

S I
7
54 23
8
27 12
33
C
96

44
45
Probabilidad clásica.

Experimento aleatorio: Un experimento aleatorio es aquel que, cuando se


le repite bajo las mismas condiciones, el resultado que se observa no siem-
pre es el mismo y tampoco es predecible. El lanzar una moneda al aire y
observar la cara de la moneda que mira hacia arriba al caer, o registrar el
número ganador en un juego de loterı́a, son ejemplos cotidianos de experi-
mentos aleatorios.

Ejemplos

. ξ1 :Lanzar una moneda para ver si sale cara o sello

. ξ2 :Lanzar un dado y ver que número salió

. ξ3 :Lanzar 3 monedas y observar los resultados

Espacio muestral: El espacio muestral, también llamado espacio muestra


de un experimento aleatorio, es el conjunto de todos los posibles resultados
del experimento y se le denota, generalmente, por la letra griega Ω o la letra
mayúscula S.

Ejemplos. Construitremos el espacio muestral del los experimentos antes


mencionados

. Ω1 = {c, s}

. Ω2 = {1, 2, 3, 4, 5, 6}

. Ω3 = {ccc, ccs, csc, css, scc, scs, ssc, sss}

Evento o suceso: Un evento, por ejemplo A, está asociado a un espacio


muestral del experimento aleatorio, de modo que A es subconjunto del espa-
cio muestral. Los eventos serán denotados con letras mayúsculas(A, B, C, D,
E, etc...)

Por ejemplo, consideremos el experimento de lanzar un dado, el espacio mus-


tral de este experimento es Ω = {1, 2, 3, 4, 5, 6}. Ahora, defina los siguientes
eventos:

46
. A: el evento de obtener un número par en el lanzamiento de un dado,
entonces A = {2, 4, 6}

. B: el evento de obtener un número menor que 3 en el lanzamiento de


un dado, entonces B = {1, 2}

Probabilidad: La probabilidad de un evento A es un número real en el


intervalo [0, 1] , que se denota por P (A) y representa una medida de la fre-
cuencia con la que se observa la ocurrencia de este evento cuando se efectúa
el experimento aleatorio en cuestión.

Definición. Sea A un subconjunto de un espacio muestral Ω de cardinalidad


finita. Se define la probabilidad clásica del evento A como el cociente
#A
P (A) = (1)
#Ω
Donde el sı́mbolo #A denota la cardinalidad o número de elementos del con-
junto A.

Claramente esta definición es solo válida para espacios muestrales finitos,


pues forzosamente necesitamos suponer que el número de elementos en Ω
es finito. Además, el espacio Ω debe ser equiprobable, pues para calcular la
probabilidad de un evento A, únicamente necesitamos contar el número de
elementos de A y dividir entre el número de elementos de Ω, sin importar
exactamente cuáles elementos particulares sean.

Ejemplo 1. Considere el experimento aleatorio de lanzar un dado equili-


brado. El espacio muestral es el conjunto Ω = {1, 2, 3, 4, 5, 6}. Si deseamos
calcular la probabilidad (clásica) del evento A, correspondiente a obtener un
número par, es decir, la probabilidad de A = {2, 4, 6}, entonces
#A 3 1
P (A) = = =
#Ω 6 2
Ejemplo 2. Una moneda equilibrada y marcada con “cara” y “sello” se lanza
4 veces consecutivas. Calcule la probabilidad de que caigan el mismo número
de caras y sellos. El espacio muestral de este experimento es

Ω ={CCCC, CCCS, CCSC, CCSS, CSCC, CSCS, CSSC


CSSS, SCCC, SCCS, SCSC, SCSS, SSCC, SSCS, SSSC, SSSS}

47
Y definamos a A como el evento ”se obtienen 2 caras y 2 sellos”, entonces

A = {CCSS, CSCS, CSSC, SCCS, SCSC, SSCC}


De modo que, la probabilidad requerida es:
#A 6
P (A) = =
#Ω 16

Ejemplo 3. Se sabe que en un lote de producción de tamaño 100, el 5 por


ciento es defectuoso. Una muestra aleatoria de 10 artı́culos se selecciona sin
reemplazo. Para determinar la probabilidad de que no habra artı́culos de-
fectuosos en la muestra, recurriremos a contar tanto el número de muestras
posibles como el número de muestras favorables al evento A, donde se consi-
dera este como el evento en el que no existen defectos. El número de formas
de elegir 10 artı́culos de 100 es 100
10
= 100!
10!(100−10)!

Sabemos que en el lote de 100 artı́culos hay 5 defectuosos, entoces la forma


de de no elegir ninguno de esos  artı́culos defectuosos y elegir 10 artı́culos
5 95

de los 95 no defectuosos es 0 10 , luego la probabilidad de que no habra
artı́culos defectuosos en la muestra es:
5 95
 
0 10
P (A) = 100
 = 0, 58375
10

Axiomas de probabilidad.

Sea Ω el espacio muestral relacionado a un experimento aleatorio y sea A un


evento cualquiera de ese espacio muestral, entonces

1. Si ∅ es el conjunto vacı́o, entonces P (∅) = 0

2. 0 ≤ P (A) ≤ 1

3. P (Ω) = 1

Propiedades.
Sean A y B dos eventos cualesquiera de un experimento aleatorio con espacio
muestral finito y equiprobable, entonces se tienen las siguientes propiedades.

48
1. P (Ac ) = 1 − P (A)

2. Si A ⊆ B, entonces P (A) ≤ P (B)

3. P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

4. Si A y B son conjuntos disyuntos, es decir, (A ∩ B) = ∅, entonces


P (A ∪ B) = P (A) + P (B)

Ejemplo 4. La probabilidad de Laura gane el curso de Estadı́stica es de 2/3,


la probabilidad de que gane el curso de Cálculo es de 4/9 y la probabilidad
de que gane ambos cursos es de 1/4, ¿cuál es la probabilidad de que Laura
apruebe al menos un curso?

Solución. Si E es el evento aprobar Estadı́stica y C el evento aprobar Cálcu-


lo, entonces la probabilidad requerida se traduce a:
2 4 1 31
P (E ∪ C) = P (E) + P (C) − P (E ∩ C) = + − =
3 9 4 36

Ejemplo 5. La siguiente tabla muestra la clasificación de los estudiantes de


una escuela de negocios.

Pregrado/Postgrado Finanzas (F) Administración (A) Gerencia (G) Total


Ingenieros (I) 320 310 125 755
Contadores (C) 410 245 180 835
Total 730 555 305 1590
Se selecciona un estudiante al azar, calcule la probabilidad de que:

a. Sea contador

b. Sea ingeniero y cursa postgrado en finanzas

c. Sea contador o curse postgrado en gerencia

Solución.

a.
835
P (C) = = 0, 525
1590

49
b.
320
P (I ∩ F ) = = 0, 2
1590
c.
835 305 180
P (C ∪ G) = P (C) + P (G) − P (C ∩ G) = + − = 0, 603
1590 1590 1590

Probabilidad condicional.

La probabilidad condicional es un concepto elemental pero muy importante,


que se utiliza con mucha frecuencia en el cálculo de probabilidades. En los
resultados que veremos a continuación mostraremos las situaciones en las
que se aplica la probabilidad condicional para reducir ciertas probabilidades
a expresiones más sencillas.

Definición. Sean A y B dos eventos y supongamos que B tiene probabilidad


estrictamente positiva. La probabilidad condicional del evento A, dado el
evento B, se denota por el simbolo P (A/B). Es la probabilidad de ocurra el
evento A cuando se sabe que el evento B ya ha ocurrido y se define como el
cociente
P (A ∩ B)
P (A/B) = (2)
P (B)
Ejemplo 6. Considere el experimento de lanzar un dado y defina los eventos

A = {2}, ”Se obtiene el número 2”,

B = {2, 4, 6}, ”Se obtiene un número par”.

Es claro que P(A) = 1/6, sin embargo, sabiendo que B ha ocurrido, es decir,
sabiendo que el resultado es un número par, la probabilidad del evento A es
ahora
P (A ∩ B) 1/6 1
P (A/B) = = =
P (B) 3/6 3
Es decir, la información adicional de la ocurrencia del evento B ha hecho que
la probabilidad de A se incremente de 1/6 a 1/3.

La probabilidad condicional también cumple los axiomas de probabilidad.

1. P (∅/B) = 0

50
2. P (Ω/B) = 1

3. 0 ≤ P (A/B) ≤ 1

La probabilidad condicional P(A/B) cumple las siguientes propiedades

1. P [(A1 ∪ A2 )/B] = P (A1 /B) + P (A2 /B) − P [(A1 ∩ A2 )/B]

2. P [(A1 ∪ A2 )/B] = P (A1 /B) + P (A2 /B), seindo (A1 ∩ A2 ) = ∅

3. P (A/B) = 1 − P (Ac /B)

Ejemplo 7. Un grupo de personas esta compuesto de 60 % hombres y 40 %


de mujeres. De los hombres, el 30 % fuma y de las mujeres, el 20 % fuma.
Si una persona de este grupo se escoge al azar, encuentre la probabilidad de
que:

a) Sea hombre y fume

b) Sea hombre y no fume

c) Sea mujer y fume

d) Sea mujer y no fume

e) Sea hombre dado que se sabe que fuma

f) Sea mujer dado que se sabe que no fuma.

Solución. Antes de dar respuesta a cada inciso, resulta muy favorable cons-
truir una tabla de probabilidades con la información que se tiene.

Sabemos que los hombres representan el 60 % y que 30 %de ellos fuma, en-
tonces los hombres que fuman representan en la población el 0, 6 · 0, 3 = 0, 18
visto como proporción o 18 % visto como porcentaje. Usando el resto de la
información y el mismo razonamiento se llega a la siguiente tabla.

Mujer (M) Hombre (H) Total


Fuma (F) 0,08 0,18 0,26
No fuma (F c ) 0,32 0,42 0,74
Total 0,4 0,6 1

51
a) P (H ∩ F ) = 0, 18

b) P (H ∩ F c ) = 0, 42

c) P (M ∩ F ) = 0, 08

d) P (M ∩ F c ) = 0, 32
P (H∩F ) 0,18
e) P (H/F ) = P (F )
= 0,26
= 0, 69
P (M ∩F c ) 0,32
f) P (M/F c ) = P (F c )
= 0,74
= 0, 43

Definición. Sea Ω el espacio muestral de un experimento aleatorio. Decimos


que la colección de eventos B1 , B2 , ..., Bn es una partición finita de Ω si se
cumplen las siguientes condiciones:

1. Bi 6= ∅ para i = 1, 2, ..., n

2. Bi ∩ Bj = ∅ para i 6= j
n
[
3. Bi = Ω
i=1

Teorema de probabilidad total.


Sea B1 , B2 , ..., Bn una partición de Ω tal que, P (Bi ) 6= 0, para i = 1, 2, ..., n.
Para cualquier evento A

n
X
P (A) = P (A/Bi )P (Bi ) (3)
i=1

Ejemplo 8. Suponga que en una población humana de igual número de


hombres y mujeres, el 4 % de hombres son daltónicos y el 1 % de las mujeres
son daltónicas. Una persona es elegida al azar, ¿cuál es la probabilidad de
que sea daltónica?

Solución. Definamos primero los eventos de interés. Sea M el evento “La


persona escogida es mujer”, H el evento “La persona escogida es hombre” y

52
D el evento “La persona escogida es daltónica”.

Deseamos calcular P (D) y tenemos que P (M ) = P (H) = 0, 5, P (D/H) =


0, 04 y P (D/M ) = 0, 01. Por el teorema de probabilidad total,

P (D) = P (D/M )P (M ) + P (D/H)P (H)


= (0, 01)(0, 5) + (0, 04)(0, 5)
1
=
40
= 0, 025

Teorema de Bayes.
Sea B1 , B2 , ..., Bn una partición de Ω tal que, P (Bi ) 6= 0, para i = 1, 2, ..., n.
Sea A un evento tal que, P (A) 6= 0, entonces para cada j = 1, 2, ..., n,

P (A/Bj )P (Bj )
P (Bj /A) = n (4)
X
P (A/Bj )P (Bj )
j=1

Ejemplo 9. En una fábrica hay dos máquinas. La máquina 1 realiza el 60 %


de la producción total y la máquina 2 el 40 %. De su producción total, la
máquina 1 produce 3 % de material defectuoso, la 2 el 5 %. El asunto es que
se ha encontrado un material defectuoso. ¿Cuál es la probabilidad de que
este material defectuoso provenga de la máquina 2?

Solución. Es conveniente definir los siguientes eventos:

D: El material es defectuoso

M1 : El material fue producido por la máquina 1

M2 : El material fue producido por la máquina 2

La pregunta planteada se traduce en encontrar P (M2 /D) y observamos que


la información que tenemos es:

53
P (M1 ) = 0, 6; P (M2 ) = 0, 4; P (D/M1 ) = 0, 03 y P (D/M2 ) = 0, 05

Usando el teorema de Bayes tenemos que:

P (D/M2 )P (M2 )
P (M2 /D) =
P (D/M1 )P (M1 ) + P (D/M2 )P (M2 )
(0, 05)(0, 4)
=
(0, 03)(0, 6) + (0, 05)(0, 4)
= 0, 53

Ejemplo 10. Existen tres teorı́as económicas principales: I, que la inflación


va a desaparecer pronto; D, que ocurrirá la depresión, y R, que ocurrirá la
recesión. Las probabilidades de que I, D o R ocurran son 0,32; 0,40 y 0,28,
respectivamente. Las probabilidades de que las acciones de la compañia Alpes
tripliquen su valor si ocurre I, D o R son 0,60; 0,90 y 0,20 respectivamente.
Si las acciones triplican su valor, la probabilidad de que la inflación haya
desaparecido es de

Solución. Definamos a A como el evento ”las acciones de la compañia tri-


plican su valor”, además tenemos que:

P (I) = 0, 32 ; P (D) = 0, 4 y P (R) = 0, 28,

P (A/I) = 0, 6 ; P (A/D) = 0, 9 y P (A/R) = 0, 2

La probabilidad requerida es P (I/A), usando el teorema de Bayes tenemos


que,

P (A/I)P (I)
P (I/A) =
P (A/I)P (I) + P (A/D)P (D) + P (A/R)P (R)
(0, 6)(0, 32)
=
(0, 6)(0, 32) + (0, 9)(0, 4) + (0, 2)(0, 28)
= 0, 315

Independencia de eventos
El concepto de independencia representa la situación cuando la ocurrencia

54
de un evento no afecta la probabilidad de ocurrencia de otro evento. Es un
concepto importante que se deriva de observaciones de situaciones reales y su
utilización reduce considerablemente el cálculo de probabilidades conjuntas.

Definición Se dice que los eventos A y B son independientes si se cumple la


igualdad

P (A ∩ B) = P (A)P (B) (5)

Ejemplo 11.Considere un experimento aleatorio con espacio muestral equi-


probable Ω = {1, 2, 3, 4} y considere los siguientes eventos

A = {1, 2}, B = {1, 3} y C = {1, 2, 3}

¿Son A y B independientes?
#(A∩B) 1
Note que, A ∩ B = {1}, entonces P (A ∩ B) = #Ω
= 4

#A #B
Además P (A) = #Ω
= 2/4 y P (B) = #Ω
= 2/4

Luego, P (A)P (B) = (2/4)(2/4) = 1/4 = P (A ∩ B), entonces A y B son


independientes.

¿Son B y C independientes?
#(B∩C) 2
B ∩ C = {1, 3}, entonces P (B ∩ C) = #Ω
= 4

P (B) = 2/4 y P (C) = 3/4

Luego, P (B)P (C) = (2/4)(3/4) = 3/8 6= P (B ∩ C), entonces B Y C no son


independientes

Ejemplo 12.
De 260 estudiantes de 7mo semestre de Ing Mecánica de la Universidad de
Córdoba, 80 están haciendo un curso cocina, 96 están haciendo un curso de
seguridad en el trabajo y 50 están haciendo un curso de idiomas. En la misma
información se encontró que algunos están haciendo 2 cursos a la vez: cocina
y seguridad 35, cocina e idiomas 20, seguridad e idiomas 15. Además 8 están
haciendo los 3 cursos al tiempo.

55
Si se selecciona un estudiante al azar, calcule la probabilidad de que:

a) no esté haciendo ningún curso

b) Esté haciendo el curso de cocina o seguridad

c) Esté haciendo el curso de idiomas si se sabe que está haciendo el curso


de seguridad.

Solución

S I
7
54 23
8
27 12
33
C
96

a)

96
P [(S ∪ I ∪ C)c ] = = 0, 37
260
b)

96 80 35 141
P (C ∪ S) = P (C) + P (S) − P (C ∩ S) = + − =
260 260 260 260
c)
15
P (I ∩ S) 260 15
P (I/S) = = 96 =
P (S) 260
96

56
Ejemplo 13.
Una empresa de Monterı́a utiliza 3 hoteles locales para hospedar a sus clientes
que provienen de otras ciudades. De pasadas experiencias se sabe que el 20 %
de ellos son hospedados en el hotel Boreal, el 50 % en el hotel Miami y el 30 %
en el hotel Sinú. el 4 %, el 6 % y el 10 % de los clientes de los hoteles Boreal,
Miami y Sinú, respectivamente, presentaban quejas sobre el servicio prestado.

Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que haya pre-


sentado quejas por el servicio?

Si la persona elegida presentó quejas por el servicio, ¿cuál es la probabilidad


de que se haya hospedado en el hotel Boreal?

Solución.
Se definen los siguientes eventos

B: El cliente fue asignado al hotel Boreal


M: El cliente fue asignado al hotel Miami
S: El cliente fue asignado al hotel Sinú
Q: El cliente presentó quejas por el servicio

Entonces, tenemos que:

P (B) = 0, 2, P (M ) = 0, 5 y P (S) = 0, 3

Además P (Q/B) = 0, 04, P (Q/M ) = 0, 06 y P (Q/S) = 0, 1

La primera pregunta se traduce a calcular P (Q), y usando el teorema de


probabilidad total,

P (Q) = P (Q/B)P (B) + P (Q/M )P (M ) + P (Q/S)P (S)


= (0, 04)(0, 2) + (0, 06)(0, 5) + (0, 1)(0, 3)
= 0, 068

La segunda pregunta se traduce a calcular P (B/Q), y por el teorema de


Bayes, esto es:

57
P (Q/B)P (B)
P (B/Q) =
P (Q/B)P (B) + P (Q/M )P (M ) + P (Q/S)P (S)

Como se puede notar, el denominador de esa esxpresı́on corresponde a la


probabilidad calculada anteriormente, luego,

(0, 04)(0, 2)
P (B/Q) = = 0, 117
0, 068

58

También podría gustarte